کتاب Data Labeling in Machine Learning with Python: Explore modern ways to prepare labeled data for training and fine-tuning ML and generative AI models (برچسبگذاری دادهها در یادگیری ماشینی با پایتون: روشهای مدرن برای آمادهسازی دادههای برچسبدار برای آموزش و تنظیم دقیق ML و مدلهای هوش مصنوعی مولد را بررسی کنید) راهنمای جامعی است که به تکنیکهای مدرن آمادهسازی دادههای برچسبدار برای آموزش و تنظیم دقیق یادگیری ماشین و مدلهای هوش مصنوعی مولد میپردازد.
کتاب Data Labeling in Machine Learning with Python کاوش عمیقی از روشهای برچسبگذاری دادهها و اجرای آنها با استفاده از پایتون را در اختیار خوانندگان قرار میدهد و بینشهای ارزشمندی را در مورد فرآیند حیاتی ایجاد مجموعههای داده برچسبگذاری شده با کیفیت بالا ارائه میدهد.
کتاب Data Labeling in Machine Learning with Python با استفاده از روشها و ابزارهای عملی، دانشمندان داده و متخصصان یادگیری ماشین را به دانش و مهارتهایی مجهز میکند تا به طور مؤثر چالشهای برچسبگذاری دادهها را مدیریت کنند و آنها را قادر میسازد تا عملکرد و دقت مدلهای ML و AI خود را افزایش دهند. چه یک حرفهای با تجربه و چه تازه وارد در این زمینه باشید، این کتاب به عنوان یک همراه ضروری برای تسلط بر هنر برچسبگذاری دادهها و به حداکثر رساندن پتانسیل یادگیری ماشینی و برنامههای کاربردی هوش مصنوعی مولد است.
در ادامه مقدمهای از کتاب Data Labeling in Machine Learning with Python را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Labeling in Machine Learning with Python:
در عصر مبتنی بر داده امروزی که روزانه بیش از ۲.۵ کوینتیلیون بایت داده به اشکال مختلف مانند متن، تصویر، صدا و ویدئو تولید میشود، دادهها سنگ بنای انقلاب هوش مصنوعی هستند.
با این حال، اکثر دادههای دنیای واقعی موجود برای آموزش مدلهای یادگیری ماشینی تحت نظارت فاقد برچسب هستند، یا با دادههای برچسبدار محدودی مواجه میشویم. این یک چالش مهم است، زیرا دادههای برچسبگذاری شده برای آموزش هر مدل یادگیری ماشینی نظارت شده و تنظیم دقیق مدلهای زبان بزرگ در عصر هوش مصنوعی ضروری است.
برای رسیدگی به کمبود دادههای برچسبگذاریشده و تسهیل آمادهسازی دادههای برچسبگذاریشده برای آموزش مدلهای یادگیری ماشینی تحت نظارت و تنظیم دقیق مدلهای زبان بزرگ، این کتاب روشهای مختلفی را برای برچسبگذاری دادههای برنامهای با استفاده از کتابخانهها و روشهای پایتون، از جمله یادگیری نیمهنظارتشده و بدون نظارت معرفی میکند.
کتاب Data Labeling in Machine Learning with Python شما را در فرآیند بارگیری و تجزیه و تحلیل دادههای جدولی، تصاویر، ویدئوها، صدا و متن با استفاده از کتابخانههای مختلف پایتون، OpenAI API، LangChain و یادگیری ماشینی Azure راهنمایی میکند. این روش تکنیکهایی مانند نظارت ضعیف، شبه برچسبگذاری و خوشهبندی K-means را برای طبقهبندی و برچسبگذاری بررسی میکند، در حالی که روشهای تقویت دادهها را برای افزایش دقت ارائه میدهد.
کتاب Data Labeling in Machine Learning with Python با استفاده از Azure OpenAI API و LangChain، اتوماسیون تجزیه و تحلیل دادهها را با استفاده از زبان طبیعی بدون نیاز به کسب هیچ گونه مهارت برنامهنویسی نشان میدهد. همچنین شامل طبقهبندی و برچسبگذاری دادههای متنی با استفاده از OpenAI و مدلهای زبان بزرگ (LLM) میشود. این کتاب طیف گستردهای از ابزارهای حاشیهنویسی داده منبع باز را به همراه یادگیری ماشینی Azure پوشش میدهد و مزایا و معایب این ابزارها را با هم مقایسه میکند.
نمونههای دنیای واقعی از صنایع مختلف برای نشان دادن کاربرد این روشها در دادههای جدولی، متنی، تصویری، ویدئویی و صوتی گنجانده شده است.
با نتیجهگیری این کتاب، شما مهارتهای کشف انواع مختلف دادهها را با استفاده از Python و OpenAI LLM به دست خواهید آورد. شما یاد خواهید گرفت که چگونه دادهها را با برچسبها آماده کنید، چه برای آموزش مدلهای یادگیری ماشینی یا باز کردن اطلاعات بینش در مورد دادهها برای استفاده در موارد استفاده تجاری در صنایع.
بیشتر بخوانید: کتاب Probabilistic Machine Learning An Introduction
کتاب Data Labeling in Machine Learning with Python برای چه کسی است؟
این کتاب برای مهندسان مشتاق هوش مصنوعی، مهندسان یادگیری ماشین، دانشمندان داده و مهندسان داده است که میخواهند در مورد روشها و الگوریتمهای برچسبگذاری دادهها برای آموزش مدل بیاموزند. علاقهمندان به داده و توسعهدهندگان پایتون میتوانند از کتاب Data Labeling in Machine Learning with Python برای یادگیری در مورد کاوش دادهها و حاشیهنویسی با استفاده از کتابخانههای پایتون استفاده کنند.
آنچه کتاب Data Labeling in Machine Learning with Python پوشش میدهد:
فصل ۱، کاوش دادهها برای یادگیری ماشین، مروری بر روشهای تجزیه و تحلیل دادهها و تجسم با استفاده از کتابخانههای مختلف پایتون ارائه میدهد. علاوه بر این، با استفاده از OpenAI LLMs عمیقاً به باز کردن بینشهای داده با زبان طبیعی میپردازد.
فصل ۲، برچسبگذاری دادهها برای طبقهبندی، فرآیند برچسبگذاری دادههای جدولی برای مدلهای طبقهبندی آموزشی را پوشش میدهد. روشهای مختلفی مانند توابع اسنورکل پایتون، یادگیری نیمهنظارتشده و خوشهبندی دادهها با استفاده از K-means مورد بررسی قرار میگیرند.
فصل ۳، برچسبگذاری دادهها برای رگرسیون، به برچسبگذاری دادههای جدولی برای مدلهای رگرسیون آموزشی میپردازد. تکنیکها شامل استفاده از آمار خلاصه، ایجاد برچسبهای شبه، استفاده از روشهای افزایش دادهها و استفاده از خوشهبندی K-means است.
فصل ۴، کاوش دادههای تصویر، تجزیه و تحلیل و تجسم دادههای تصویر و استخراج ویژگی از تصاویر با استفاده از کتابخانههای مختلف پایتون را پوشش میدهد.
فصل ۵، برچسبگذاری دادههای تصویر با استفاده از قوانین، برچسبگذاری تصاویر بر اساس اکتشافات و ویژگیهای تصویر مانند نسبت ابعاد را مورد بحث قرار میدهد و همچنین طبقهبندی تصویر را با استفاده از طبقهبندیکنندههای از پیش آموزشدیدهشده مانند YOLO پوشش میدهد.
فصل ۶، برچسبگذاری دادههای تصویر با استفاده از تقویت داده، روشهای تقویت دادههای تصویر را برای ماشینهای بردار پشتیبان آموزشی و شبکههای عصبی کانولوشنال (CNN) و همچنین نشانگذاری دادههای تصویر را بررسی میکند.
فصل ۷، برچسبگذاری دادههای متنی، هوش مصنوعی تولیدی و روشهای مختلف برای برچسبگذاری دادههای متنی را پوشش میدهد. این شامل Azure OpenAI با موارد استفاده در دنیای واقعی، طبقهبندی متن، و تجزیه و تحلیل احساسات با استفاده از Snorkel و K-means clustering است.
فصل ۸، کاوش دادههای ویدئویی، بر بارگیری دادههای ویدئویی، استخراج ویژگیها، تجسم دادههای ویدئویی و خوشهبندی دادههای ویدئویی با استفاده از خوشهبندی K-means تمرکز دارد.
فصل ۹، برچسبگذاری دادههای ویدئویی، به برچسبگذاری دادههای ویدئویی با استفاده از CNN، تقسیمبندی دادههای ویدئویی با الگوریتم آبخیز، و گرفتن ویژگیهای مهم با استفاده از رمزگذارهای خودکار، همراه با نمونههای واقعی میپردازد.
فصل ۱۰، کاوش دادههای صوتی، مبانی دادههای صوتی، بارگیری و تجسم دادههای صوتی، استخراج ویژگیها و برنامههای کاربردی واقعی را ارائه میدهد.
فصل یازدهم کتاب Data Labeling in Machine Learning with Python، برچسبگذاری دادههای صوتی، رونویسی دادههای صوتی با استفاده از مدل Whisper OpenAI، برچسبگذاری رونویسی، ایجاد طیفنگاری برای طبقهبندی دادههای صوتی، تقویت دادههای صوتی، و استفاده از خدمات شناختی Azure برای گفتار را پوشش میدهد.
فصل ۱۲، کاوش عملی ابزارهای برچسبگذاری داده، ابزارهای برچسبگذاری دادههای مختلف، از جمله ابزارهای منبع باز مانند Label Studio، CVAT، pyOpenAnnotate، و یادگیری ماشینی Azure را پوشش میدهد. همچنین شامل مقایسه ابزارهای مختلف برچسبگذاری داده برای دادههای تصویر، متن، صدا و ویدئو میشود.
سرفصلهای کتاب Data Labeling in Machine Learning with Python:
- Data Labeling in Machine Learning with Python
- Acknowledgments
- Contributors
- About the author
- About the reviewers
- Preface
- Part 1: Labeling Tabular Data
- Chapter 1: Exploring Data for Machine Learning
- Chapter 2: Labeling Data for Classification
- Chapter 3: Labeling Data for Regression
- Part 2: Labeling Image Data
- Chapter 4: Exploring Image Data
- Chapter 5: Labeling Image Data Using Rules
- Chapter 6: Labeling Image Data Using Data Augmentation
- Part 3: Labeling Text, Audio, and Video Data
- Chapter 7: Labeling Text Data
- Chapter 8: Exploring Video Data
- Chapter 9: Labeling Video Data
- Chapter 10: Exploring Audio Data
- Chapter 11: Labeling Audio Data
- Chapter 12: Hands-On Exploring Data Labeling Tools
- Index
- Other Books You May Enjoy
جهت دانلود کتاب Data Labeling in Machine Learning with Python میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.