کتاب Training Data for Machine Learning: Human Supervision from Annotation to Data Science (دادههای آموزشی برای یادگیری ماشینی: نظارت انسانی از حاشیهنویسی تا علم داده) کاربرد علوم داده در یادگیری ماشین را شرح میدهد.
در ادامه مقدمهای از کتاب Training Data for Machine Learning را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Training Data for Machine Learning:
هر فنآوری به اندازه کافی پیشرفته غیر قابل تشخیص از سحر و جادو است.
آرتور سی کلارک
کار، شغل یا زندگی روزمره شما ممکن است تحت تأثیر هوش مصنوعی (AI) قرار گرفته باشد یا در شرف قرار گرفتن باشد. کتاب Training Data for Machine Learning به ایجاد و بهبود درک شما از مفاهیم و مکانیک پشت بخش کلیدی هوش مصنوعی به نام دادههای آموزشی کمک میکند.
آیا واقعاً زندگی شما تحت تأثیر قرار میگیرد؟ در اینجا یک آزمایش است. آیا در زمینه فناوری مشغول به کار هستید و روی یک محصول نرمافزاری کار میکنید؟ آیا کار شما یا محصول شرکت شما، وظایف تکراری دارد؟ کارهایی که شما یا کاربران محصولتان در یک چرخه منظم انجام میدهید؟
اگر پاسخ شما به هر یک از این سؤالات مثبت است، هوش مصنوعی و یادگیری ماشینی (ML) این پتانسیل را دارند که حجم کار بیشتری را به عهده بگیرند و به شما یا کاربرانتان این امکان را میدهند تا روی کارهای سطح بالاتر تمرکز کنید و بنابراین بر شما تأثیر خواهد گذاشت.
بیشتر بخوانید: کتاب The Art of Machine Learning
اگر میخواهید با این موج جدید هوش مصنوعی هماهنگتر شوید، کتاب Training Data for Machine Learning بسیاری از مهرهها و پیچها را نشان میدهد که باعث میشوند هوش مصنوعی در عمل عمل کند. این به تسریع موفقیت شما در شغل فعلی کمک میکند و شما را برای نقشهای جدید مبتنی بر هوش مصنوعی آماده میکند.
وقتی صحبت از شغل شد، میدانید که چند روز یا هفته اول کار جدید چقدر استرسزا، دیوانهکننده، غیرقابل پیشبینی است؟ سپس ناگهان، کار، همه چیزهای روزمره، در جای خود قرار میگیرد و معنا پیدا میکند؟ چیزی که زمانی غیرقابل تصور بود، عادی میشود، زیرا یاد گرفتی که چگونه خود را با خود وفق دهی. در مدت زمان نسبتاً کوتاهی، از ریختن قهوه روی پیراهن رئیس به بخش سازندهای از سیستم تبدیل میشوید.
هوش مصنوعی به روشی مشابه کار میکند. تفاوت این است که رئیس هوش مصنوعی شما هستید! شما مسئول آموزش اولیه و مداوم هوش مصنوعی هستید. مانند یک عضو جدید تیم، زمانی که هوش مصنوعی برای اولین بار تمرین میکند، نتایج غیرقابل پیشبینی هستند. با گذشت زمان، با آموزش و نظارت بیشتر، بهتر میشود.
در واقع، آنقدر سریع اتفاق میافتد، که فرضیات در مورد اینکه چه چیزی خودکار است و چه چیزی که نیست، وارونه میشود. این نظارت سطح بالا برای همه سیستمهای هوش مصنوعی، از ماشینهای خودران گرفته تا تشخیص علفهای هرز کشاورزی، تشخیصهای پزشکی، امنیت، تجزیه و تحلیل ورزشی و غیره مورد نیاز است.
من پرده این اساسیترین جنبه هوش مصنوعی را کنار میکشم: نقشهبرداری از معنای انسان به شکلی قابل خواندن با هوش مصنوعی، که در غیر این صورت به عنوان دادههای آموزشی شناخته میشود.
این برای همهچیز از هوش مصنوعی مولد گرفته تا سیستمهای کاملاً تحت نظارت اهمیت دارد. من به شما کمک خواهم کرد تا مفاهیم و مفاهیم زیادی را در مورد دادههای آموزشی درک کنید. ما نحوه عملکرد آن را در عمل پوشش خواهیم داد، از جمله عملیات، ابزار، اتوماسیون و طراحی سیستم. و ما همه آن را با مطالعات موردی و نکات عملی کنار هم خواهیم گذاشت.
دانش شما جادویی است که باعث میشود هوش مصنوعی کار کند. هوش مصنوعی شما را قادر میسازد تا دسترسی خود را گسترش دهید. برای انجام کارهای خلاقانهتر. تا اثربخشی دانش خود را چند برابر کنید. و اگر بتوانید نحوه آموزش هوش مصنوعی را بیاموزید، ذینفع خواهید بود.
چه کسی باید کتاب Training Data for Machine Learning را بخواند؟
این کتاب یک مرور کلی از دادههای آموزشی است. این به طورایدهآل برای کسانی که کاملاً جدید هستند، یا تازه شروع کردهاند، با دادههای آموزشی مناسب است.
برای تمرینکنندگان متوسط، فصلهای بعدی کتاب Training Data for Machine Learning ارزش و بینش منحصربهفردی را ارائه میکنند که در هیچ جای دیگری نمیتوان یافت. به طور خلاصه، دانش خودی. من زمینههای خاص مورد علاقه کارشناسان موضوع، مدیران گردش کار، مدیران دادههای آموزشی، مهندسان داده، و دانشمندان داده را برجسته خواهم کرد.
دانش علوم کامپیوتر (CS) مورد نیاز نیست. دانستن CS، یادگیری ماشین یا علم داده بخشهای بیشتری از کتاب را در دسترس قرار میدهد. من تلاش میکنم این کتاب را برای حاشیهنویسان دادهها، از جمله کارشناسان موضوع، حداکثر در دسترس قرار دهم، زیرا آنها نقشی کلیدی در آموزش دادهها، از جمله نظارت بر سیستم دارند.
برای حرفهای فنی و مهندس
ممکن است به دنبال ارسال یا بهبود یک سیستم بوده باشید، یا دیده باشید که یک قابلیت هوش مصنوعی جدید نشان داده شده است و به دنبال اعمال آن در دامنه خود هستید. این کتاب شما را از طریق این فرآیندها راهنمایی میکند، و همچنین به سؤالات دقیقتری، مانند انواع رسانههایی که باید استفاده کنید، چگونه سیستم را سیمکشی کنید، و اتوماسیونها چه اهمیتی دارند، راهنمایی میکند.
رویکردهای زیادی وجود دارد، و هدف کتاب Training Data for Machine Learning این است که پوشش متعادلی را برای شما فراهم کند، مبادلات را برجسته کند و مرجع اصلی برای نیازهای داده آموزشی شما باشد. مفاهیم جدید بسیار زیادی وجود دارد که گاهی اوقات ممکن است مانند خواندن اسناد به نظر برسد. در صورت امکان، تمام تلاشم را کردهام تا سبک کتاب را بر روی بحث «بینالمللی» از نوع کافیشاپ متمرکز کنم که در اسناد عمومی وجود ندارد.
اگر شما یک متخصص هستید، پس کتاب Training Data for Machine Learning میتواند به عنوان یک مرجع، تجدیدکننده، و راه آسان برای انتقال مفاهیم اصلی به افراد جدید در تیم شما عمل کند. آیا از قبل دانشی در این زمینه دارید و میخواهید کامل بودن را بررسی کنید؟ این کتاب مجموعه ابزار رویکردهای شما را گسترش میدهد و دیدگاههای جدیدی در موردایدههای رایج ارائه میدهد. و اگر کاملاً جدید هستید، این بهترین منبع شما برای شروع است.
برای مدیر و مدیر
به بیان ساده، کتاب Training Data for Machine Learning دارای محتوایی است که در هیچ جای دیگری نمیتوانید آن را دریافت کنید. منحصربهفرد بودن و چگالی زمینهای که این کتاب اضافه میکند جدید است و به شما و تیمتان کمک میکند تا بینشهایتان را باز کنید و ماهها یا حتی سالها بهطور بالقوه شما را جلوتر ببرد.
علاوه بر این، بخشهای قابل توجهی از کتاب Training Data for Machine Learning به افراد و فرآیندها اختصاص دارد. دادههای آموزشی مفاهیم جدید تعامل انسان و رایانه را ارائه میدهد و شامل سطوح تعامل بین رشتهای است که بینشهای جدید ارزشمندی را ارائه میدهد و موفقیت شما را در این زمینه هیجانانگیز هوش مصنوعی تضمین میکند.
ممکن است به خصوص به فصل ۶ کتاب Training Data for Machine Learning، «نظریهها، مفاهیم، و نگهداری»، فصل ۷، «تحول هوش مصنوعی و موارد استفاده»، و فصل ۹، «مطالعات موردی و داستانها» علاقهمند باشید. بقیه فصلها به شما کمک میکند تا با جزئیات راحت باشید تا بتوانید موفقیتها و شکستها را تشخیص دهید. این به اصلاح دوره کمک خواهد کرد.
برای کارشناس موضوع و متخصص حاشیهنویسی دادهها
حاشیهنویسها یکی از حیاتیترین نقشها برای تولید روزانه دادههای آموزشی هستند. گزارش مجمع جهانی اقتصاد ۲۰۲۰ میگوید که سه نقش برتر شغلی که افزایش تقاضا را نشان میدهند، همگی شامل تجزیه و تحلیل دادهها و هوش مصنوعی است.
دانستن نحوه کار با دادههای آموزشی یک مهارت ارزشمند برای افزودن به مهارتهای موجود شما و همچنین یک فرصت شغلی جدید در نوع خود است.
به طور فزایندهای رایج است که کارفرمایان از همه کارمندان بخواهند که اصول مربوط به هوش مصنوعی و اغلب حتی دادههای آموزشی را درک کنند.
به عنوان مثال، یک کارفرمای بزرگ خودرو در شرح شغل حاشیهنویس دادههای خود بیان میکند که متقاضی باید: \”از نحوه استفاده از برچسبها توسط الگوریتمهای یادگیری ما برای قضاوت بیشتر در مورد موارد لبه دشوار استفاده کند. \”، شما یک فرصت بزرگ برای گسترش دامنه دانش و بهره وری شرکت خود با پایهگذاری دانش خود و تیمتان در دادههای آموزشی دارید.
در حالی که هر کسی میتواند بر حوزههایی که در آنها آگاه است نظارت کند، کارشناسان موضوعی (SMEs) مانند پزشکان، وکلاً و مهندسان میتوانند بسیار ارزشمند باشند. SMEها میتوانند مستقیماً بر هوش مصنوعی نظارت کنند و دستورالعملها و آموزشهای دقیقی را برای منابع مقرون به صرفهتر ارائه دهند.
اگر شما یک شرکت کوچک و متوسط هستید، خواندن این کتاب، حتی بیشتر از نزدیک، برای درک اینکه چگونه کار شما با تصویر هوش مصنوعی مطابقت دارد، از چه دستگیرهها و اهرمهایی برای استفاده شما در دسترس است و چگونه فرآیندهایی را برای افراد دیگر تنظیم کنید، حیاتی است. دنبال کردن.
کتاب Training Data for Machine Learning همچنین به ارائه بینشی در مورد مکانیکهای آزمایش شده، مانند مفهومی به نام طرحواره، علاوه بر مواد استاندارد مانند دستورالعملهای دقیق کمک میکند. با خواندن این کتاب، درک عمیقی از همه چیزهایی که برای ایجاد و حفظ سیستمهای هوش مصنوعی مؤثر از طریق دادههای آموزشی نیاز دارید، به دست خواهید آورد.
برای دانشمند داده
به عنوان یک دانشمند داده، شما باید نقش مهمی را به عنوان مشاور برای دیگران ایفا کنید: کمک به آنها در درک نحوه استفاده واقعی از دادهها. حتی پیشرفتهترین و یکپارچهترین سیستمهای AutoML معمولاً به کسی نیاز دارند تا معنای خروجی آنها را تفسیر و درک کند و بتواند در صورت بروز مشکل، آنها را اشکالزدایی کند.
کتاب Training Data for Machine Learning به شما کمک میکند تا بهتر با شرکای فنی و حاشیهنویسی متنوع خود تعامل داشته باشید.
هر دادهای را میتوان بر روی دادههای آموزشی آموزش داد یا در نظر گرفت. مانند بسیاری از اصطلاحات (\”سیب\” میوه در مقابل \”اپل\” شرکت)، دادههای آموزشی معانی متعددی دارند.
کتاب Training Data for Machine Learning بر روی دادههای آموزشی تحت نظارت تمرکز دارد، به این معنی که یک انسان مستقیماً در غنیسازی دادهها نقش دارد. در حالی که ممکن است جزئیات حاشیهنویسی همیشه با کار روزانه شما مرتبط نباشد، درک گستردهتر میتواند به اطمینان از بهترین نتیجه ممکن کمک کند.
برای تعیین انتظارات، کتاب Training Data for Machine Learning بر روی دادههای آموزشی مدرن، و به طور خاص سیستمهای نظارت شده که در آن انسان حداقل نقشی را ایفا میکند، تمرکز دارد. حتی در زمینه هوش مصنوعی مولد، که اغلب به عنوان بدون نظارت تصور میشود، همسویی انسان نقش کلیدی ایفا میکند.
در حالی که مرزها یا سودمندی مفاهیم پیرامون تحت نظارت، خود نظارتی، نیمه نظارتی، بدون نظارت، شما-نام-آن-نظارت شده همچنان در جریان است، به نظر میرسد که بسیاری از موارد استفاده عملی با درجاتی از نظارت قابل دستیابی هستند، و این نظارت به نوعی احتمالاً برای مدت طولانی در اینجا خواهد بود.
در حین مطالعه، در اینجا چند موضوع وجود دارد که باید در نظر بگیرید. چگونه میتوانید عمیقتر با حاشیهنویسی و شرکای فنی خود درگیر شوید؟ چگونه میتوانید در فرآیندهای مجموعه داده، از جمله ایجاد و نگهداری شرکت کنید؟ چگونه میتوانید کمک کنید تا نیازهای مدلسازی خود را با طرحواره هماهنگ کنید و بالعکس؟
چگونه میتوانید اطمینان حاصل کنید که دادههای آموزشی برای مدلهای شما بهترین است؟ اگر نکتهای از کتاب Training Data for Machine Learning وجود داشته باشد، امیدوارم این باشد که شما «حاشیهنویسی دادهها» را در منظری جدید، به عنوان حوزه فناوری خودش، به نام دادههای آموزشی، ببینید.
چرا کتاب Training Data for Machine Learning را نوشتم؟
در طول سفرم با Diffgram، متوجه شکاف بزرگی بین کسانی که \”آن را دریافت کردهاند\” و کسانی که دریافت نکردهاند، شدهام. اغلب، احساس میکردم که کسی را تماشا میکنم که سعی میکند ضرب را یاد بگیرد، قبل از اینکه بداند سیستم اعداد وجود دارد. پایههای اولیه دادههای آموزشی گم شده بود (و بدتر از آن، آنها اغلب متوجه نبودند! ).
در ابتدا، من تازه شروع به نوشتن مقالات کوتاه کردم – نسبتاً مختصر، عمدتاً فقط چند صفحه، با تمرکز بر یک موضوع محدود. اینها به «درمان نقطهای» شکافهای دانش کمک کردند.
این من بودم که چیزهایی را در طاقچه کوچکم به اشتراک میگذاشتم، چیزهایی که اتفاقاً میدانستم. اما همچنان احساس میکرد که بخشهای بزرگی گم شدهاند. من نیاز داشتم چیز جامعتری بنویسم. کتاب قدم بعدی منطقی بود. اما من کی بودم که آن را بنویسم؟
وقتی شروع به نوشتن کردم شک و تردیدهای زیادی داشتم. من قبلاً حدود سه سال در این منطقه کار کرده بودم، اما هنوز احساس میکردم برخی از مطالبی که برای نوشتن برنامهریزی کردهام یک هدف «آرزوآمیز» بوده است – نه صرفاً خلاصه کردن آنچه قبلاً میدانستم. امروز که این بخش را مینویسم، با تأمل در پنج سال اخیر، هنوز احساس میکنم به سختی سطح این ناحیه را خراشیدهام.
با این حال، در این مرحله، باید به گذشته نگاه میکردم و متوجه میشدم که افراد بسیار کمی وجود داشتند که من میشناختم که سطح قابل مقایسهای از درک فنی عمیق را با افزایش کسبوکارشان حفظ کرده باشند. این بدان معنی بود که من در لیست کوتاهی از افرادی قرار گرفتم که دارای مجموعهای از ویژگیهای خاص هستند: درک فنی عمیق از این حوزه، آگاهی از تاریخچه پیشرفت آن، توانایی توضیح این موضوعات به زبان غیر مهندسی، و تمایل به برای ثبت و به اشتراکگذاری آن دانش با دیگران وقت بگذارید.
من واقعاً معتقدم که دادههای آموزشی یکی از مهمترین تغییرات مفهومی در فناوری است که در مدت زمان طولانی ظاهر شده است. دادههای آموزشی تحت نظارت، هر صنعت و تقریباً هر محصولی را به هم میرساند. در طول چند دهه آینده، من معتقدم که زندگی ما را به گونهای شکل خواهد داد که امروز به سختی میتوانیم تصور کنیم. امیدوارم کتاب Training Data for Machine Learning به شما در سفرتان کمک کند.
نحوه تنظیم کتاب Training Data for Machine Learning
ابتدا، آنچه را که میتوانید با دادههای آموزشی انجام دهید، فرصتهای کار با دادههای آموزشی، چرایی اهمیت دادههای آموزشی و دادههای آموزشی در طبیعت را معرفی میکنم (فصل ۱ کتاب Training Data for Machine Learning، «معرفی دادههای آموزشی»).
پروژههای دنیای واقعی به ابزارهای داده آموزشی نیاز دارند، و زمانی که شما واقعاً قادر به کار با آنها هستید، به پایهگذاری مفاهیم کمک میکند. برای کمک به شما برای شروع (فصل ۲ کتاب Training Data for Machine Learning، «برخاستن و دویدن»)، ما دقیقاً همین را به شما پیشنهاد میکنیم—چارچوبی برای پیشبرد و شروع به کار.
هنگامی که مفاهیم سطح بالا و برخی ابزارها را در اختیار داشتید، زمان آن فرا میرسد که در مورد طرحواره صحبت کنید – الگویی برای رمزگذاری تمام دانش تجاری شما.
طرحواره یکی از مهمترین مفاهیم در دادههای آموزشی است، بنابراین این درمان دقیق (فصل ۳، «شما») واقعاً به ایجاد این درک کمک میکند. بعد مهندسی داده (فصل ۴ کتاب Training Data for Machine Learning، «مهندسی داده») و گردش کار (فصل ۵، «جریان کاری»)، مفاهیم کلیدی مهندسی هستند که به شما کمک میکنند تا سیستم خود را راهاندازی و تولید کنید.
سپس به مفاهیم و نظریهها (فصل ۶ کتاب Training Data for Machine Learning، «نظریهها، مفاهیم و نگهداری»)، تبدیل هوش مصنوعی (فصل ۷، «تبدیل هوش مصنوعی و موارد استفاده»)، و اتوماسیون (فصل ۸، «اتوماسیون») تبدیل میشویم و با مطالعات موردی در دنیای واقعی (فصل ۹ کتاب Training Data for Machine Learning، «مطالعات موردی و داستانها»).
تمها
کتاب Training Data for Machine Learning در سه موضوع اصلی به شرح زیر تقسیم شده است.
مبانی و شروع
بیاموزید که چرا دادههای آموزشی مهم هستند و چیست. اصطلاحات پایه، مفاهیم، و انواع نمایشها را به سرعت دریافت کنید. من زمینه را چارچوببندی میکنم و با شباهتها و تفاوتهای بین رویکردهای نظارت شده و کلاسیک به ML شروع میکنم. سپس تمام جنبههای مربوط به انتزاعات، افراد، فرآیند و موارد دیگر را باز میکنم. این پایه پایه است.
مفاهیم و نظریهها
در اینجا، با نگاهی به عملیات سیستم و کاربر و رویکردهای رایج اتوماسیون، به جزئیات بیشتری میرسیم. در اینجا ما کمی از اساس فاصله میگیریم و به سمت نظرات متفاوت گسترش میدهیم.
همهاش را بگذار کنار هم
با در نظر گرفتن نیازهای بنیادی و تئوری، پیادهسازیهای خاص را بررسی میکنیم. ما روندها را بیشتر گسترش میدهیم تا موضوعات و مسیرهای تحقیقاتی پیشرفته را پوشش دهیم.
یک نکته کوچک در مورد اصطلاحات: در سراسر کتاب Training Data for Machine Learning، گاهی اوقات عبارات دادههای آموزشی و دادههای هوش مصنوعی را به صورت مترادف میبینید. دادههای هوش مصنوعی یک اصطلاح گسترده است که به هر نوع دادهای که توسط هوش مصنوعی استفاده میشود اشاره دارد. تمام دادههای آموزشی نیز دادههای هوش مصنوعی هستند.
اغلب، من از تشبیهات استفاده میکنم تا به محتوا در دسترستر و به یاد ماندنیتر کمک کنم. من عمداً از اصطلاحات فنی اجتناب میکنم مگر اینکه گنجاندن آن حیاتی باشد. اگر متخصص هستید، لطفاً هر چیزی را که قبلاً با آن آشنا هستید نادیده بگیرید. برای افراد غیرمتخصص، لطفاً در نظر بگیرید که بسیاری از جزئیات فنی فقط همین هستند – جزئیات. جزئیات به درک میافزاید اما برای آن لازم نیست.
من قصد دارم تا حد امکان بر روی دادههای آموزشی تحت نظارت متمرکز بمانم. این شامل تلاشهای کوتاهی برای یادگیری عمیق و دانش ML است، اما به طور کلی، این خارج از محدوده است. دادههای آموزشی یک مفهوم همه منظوره در سراسر صنایع است که به همان اندازه برای بسیاری از صنایع کاربرد دارد. اکثر مفاهیم ارائه شده به همان اندازه برای چندین حوزه کاربرد دارند.
علیرغم تجربه دست اول من با تکامل ML و AI، کتاب Training Data for Machine Learning یک کتاب تاریخی نیست. من فقط تاریخ را به اندازه کافی پوشش میدهم تا موضوعات فعلی را پایهریزی کنم.
نرمافزار ساخته شده حول دادههای آموزشی انواع مفروضات و محدودیتها را معرفی میکند. من سعی میکنم مفروضات پنهان را کشف کنم و مفاهیمی را که معمولاً در حلقههای منتخب شناخته شدهاند، اما برای اکثر افراد دیگر جدید هستند، برجسته کنم.
سرفصلهای کتاب Training Data for Machine Learning:
- Preface
- 1. Training Data Introduction
- 2. Getting Up and Running
- 3. Schema
- 4. Data Engineering
- 5. Workflow
- 6. Theories, Concepts, and Maintenance
- 7. AI Transformation and Use Cases
- 8. Automation
- 9. Case Studies and Stories
- Index
- About the Author
جهت دانلود کتاب Training Data for Machine Learning میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.