کتاب Data-Centric Machine Learning with Python: The ultimate guide to engineering and deploying high-quality models based on good data (یادگیری ماشینی داده محور با پایتون: راهنمای نهایی مهندسی و استقرار مدلهای با کیفیت بالا بر اساس دادههای خوب) به شما کمک میکند تا بفهمید ML/AI داده محور چیست و چگونه میتواند به شما در درک پتانسیل «دادههای کوچک» کمک کند.
با بررسی بلوکهای سازنده ML/AI دادهمحور، جنبههای انسانی برچسبگذاری دادهها را بررسی خواهید کرد، با ابهام در برچسبگذاری مقابله کرده و نقش دادههای مصنوعی را درک خواهید کرد.
در ادامه مقدمهای از کتاب Data-Centric Machine Learning with Python را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data-Centric Machine Learning with Python:
اگر در حال خواندن این مطلب هستید، اولین قدمها را در یک سفر پیشگام برای ساخت و پیادهسازی مدلهای یادگیری ماشینی برداشتهاید که قویتر، دقیقتر، منصفانهتر، کمطرفانهتر و توضیح دادن آسانتر باشد.
این یک ادعای بزرگ است، ما میدانیم. با این حال، بر اساس پتانسیل عظیم و نسبتاً استفاده نشدهای که در رویکرد داده محور به توسعه یادگیری ماشین میبینیم، راحت میتوانیم آن را بسازیم.
چرا ما یادگیری ماشینی داده محور را پیشگام میدانیم؟
ممکن است بدیهی به نظر برسد که بهبود کیفیت دادهها منجر به مدلهای پیشبینی بیشتر میشود. با این حال، تحقیقات یادگیری ماشین تا به امروز عمدتاً بر تکامل الگوریتمها و ابزارهای مختلف برای ساخت و تنظیم مدلها متمرکز بوده است.
در نتیجه، مجموعه گستردهای از الگوریتمها، ابزارها و تکنیکهای یادگیری ماشین را در اختیار داریم که با توجه به کیفیت و حجم مناسب دادههای ورودی، میتوانند با هزینه کم مدلهای عالی را در اختیار ما قرار دهند.
معماریهای مدل تا حد زیادی یک مشکل حل شده در اکثر موقعیتها هستند. آنچه دانشمندان داده و سازمانهایی که در آن کار میکنند معمولاً فاقد آن هستند، چارچوبها، ابزارها و تکنیکهای بهترین عملکرد برای بهبود کیفیت دادهها است.
یادگیری ماشینی مبتنی بر داده مبتنی بر رویکرد مدل محوری غالب برای توسعه مدل با بهرهبرداری از فرصتهای بزرگی است که در دادههای ورودی بهتر نهفته است.
تأکید بیشتر بر جمعآوری و مهندسی دادهها، ما را ملزم میکند که فرآیندهای خود را برای جمعآوری دادههای با کیفیت سادهسازی کنیم و تکنیکهای جدیدی را برای مجموعه دادههای مهندسی ابداع کنیم که سیگنالهای بیشتری را با دادههای بسیار کمتر ارائه میدهد.
بسیاری از تکنیکها و مثالهایی که در کتاب Data-Centric Machine Learning with Python با آنها آشنا میشوید، مبتنی بر تحقیقات پیشرفته و استفاده از شیوههای مدرن برای جمعآوری، مهندسی و تولید مصنوعی مجموعههای داده بزرگ هستند.
یادگیری ماشینی مبتنی بر داده همچنین مستلزم همکاری بسیار قویتر بین دانشمندان داده، متخصصان موضوع و برچسبگذاران داده است. همانطور که در سراسر این کتاب خواهید آموخت، داده محوری معمولاً با جمعآوری و برچسبگذاری دادهها توسط انسان شروع میشود به گونهای که نیازهای عملیاتی و علم داده را برآورده میکند.
در بسیاری از سازمانها، جمعآوری دادهها به طور خاص برای اهداف یادگیری ماشینی غیر معمول است. یک رویکرد سیستماتیکتر برای جمعآوری و برچسبگذاری دادهها برای علم داده نه تنها به دادههای بهتر منجر میشود، بلکه تفکر و خلاقیت متخصصان موضوع و دانشمندان داده را گرد هم میآورد.
این حلقه بازخورد مثبت بین انواع مختلف متخصصان حوزه، فرصتهای جدیدی را برای شکوفاییایدهها بسیار فراتر از محدوده پروژههای یادگیری ماشین فردی ایجاد میکند.
چرا ما ادعا میکنیم که مدلهای داده محور تقریباً از هر نظر بهتر از مدلهای مبتنی بر مدل هستند؟
به هر محصول مصرفی با کیفیتی که به طور مرتب استفاده میکنید فکر کنید. ممکن است کامپیوتر شما، ماشینی که رانندگی میکنید، صندلیای که روی آن مینشینید یا چیز دیگری باشد که به سطحی از طراحی و مهندسی نیاز دارد.
چه چیزی آن را با کیفیت میکند؟
طراحی و عملکرد ارتباط زیادی با آن دارد، اما مگر اینکه محصول از مواد با کیفیت ساخته شده باشد، آنطور که در نظر گرفته شده است کار نمیکند یا ممکن است به طور کلی خراب شود. چیزی فقط در صورتی با کیفیت است که همانطور که در نظر گرفته شده است کار کند و این کار را به طور مداوم انجام دهد.
همین امر در مورد مدلهای یادگیری ماشینی نیز صدق میکند. با بهبود سیستماتیک کیفیت دادهها – مصالح ساختمانی ما – میتوانیم مدلهایی بسازیم که پیشبینیتر، قویتر و قابل تفسیرتر باشند.
ما کتاب Data-Centric Machine Learning with Python را نوشتهایم تا به شما، خوانندگان خود، مهمترین دانش پیشزمینه، ابزارها، تکنیکها و مثالهای کاربردی مورد نیاز برای پیادهسازی یادگیری ماشینی دادهمحور و شرکت در مرحله بعدی انقلاب هوش مصنوعی را در اختیار شما قرار دهیم.
در فصلهای فنی کتاب Data-Centric Machine Learning with Python، به شما نشان میدهیم که چگونه با استفاده از پایتون، اصول یادگیری ماشین مبتنی بر داده را در مجموعه دادههای واقعی اعمال کنید.
تکنیکها و نمونههای کاربردی که بررسی میکنیم جعبه ابزاری را برای جمعآوری، پاکسازی، تقویت، و برچسبگذاری دادهها بهطور سیستماتیک و برنامهریزیشده و همچنین شناسایی و حذف سوگیریهای ناخواسته در اختیار شما قرار میدهند.
در پایان کتاب Data-Centric Machine Learning with Python، شما قدردانی شدیدی از بلوکهای سازنده و بهترین روشهای یادگیری ماشینی دادهمحور خواهید داشت.
فقط حرف ما را قبول نکنید. بیایید یادگیری ماشینی داده محور را عمیقاً بررسی کنیم.
کتاب Data-Centric Machine Learning with Python برای چه کسی است؟
این کتاب برای متخصصان علوم داده و علاقهمندان به یادگیری ماشینی است که میخواهند بدانند داده محوری چیست، مزایای آن نسبت به رویکرد مدل محوری، و نحوه اعمال بهترین رویکرد داده محوری در کارشان.
کتاب Data-Centric Machine Learning with Python همچنین برای سایر متخصصان داده و رهبران ارشد است که میخواهند ابزارها و تکنیکهایی را برای بهبود کیفیت دادهها و نحوه ایجاد فرصتهایی برای ML/AI \”دادههای کوچک\” در سازمان خود کشف کنند.
آنچه کتاب Data-Centric Machine Learning with Python پوشش میدهد:
فصل ۱، کاوش در یادگیری ماشینی مبتنی بر داده، شامل یک تعریف جامع از یادگیری ماشینی داده محور است و تضادهایی را با همتای آن، یعنی مدل محوری ترسیم میکند. ما از مثالهای عملی برای مقایسه عملکرد تجربی و نشان دادن تفاوتهای کلیدی بین این دو روش استفاده میکنیم.
فصل ۲ کتاب Data-Centric Machine Learning with Python، از مدل محور تا داده محور – تکامل ML، شما را به سفری از طریق تکامل هوش مصنوعی و ML به سمت رویکرد مدل محور میبرد، و پتانسیل استفاده نشده در بهبود کیفیت دادهها را نسبت به تنظیم مدل برجسته میکند. ما همچنین افسانه «دادههای بزرگ» را از بین میبریم و نشان میدهیم که چگونه تغییر دادن به «دادههای خوب» میتواند راهحلهای ML را دموکراتیک کند. برای دیدگاهی تازه در مورد قدرت داده در ML آماده شوید.
فصل ۳، اصول ML داده محور، با تشریح چهار اصل کلیدی ML داده محور، زمینه را برای سفر شما به قلب ML داده محور فراهم میکند. این اصول قبل از اینکه به روشها و رویکردهای خاص مرتبط با هر اصل – چه چیزی – در فصلهای بعدی کتاب Data-Centric Machine Learning with Python بپردازیم، زمینه حیاتی – چرایی – را ارائه میدهند.
فصل ۴، برچسبگذاری دادهها یک فرآیند مشارکتی است، نقش محوری تخصص موضوع، برچسبگذاران آموزش دیده، و دستورالعملهای روشن در توسعه ML را بررسی میکند. در این فصل از کتاب Data-Centric Machine Learning with Python، با ماهیت انسان محور برچسبگذاری دادهها آشنا میشوید و استراتژیهایی برای تقویت آن برای کاهش تعصب، افزایش ثبات و ایجاد مجموعه دادههای غنیتر بهدست خواهید آورد.
فصل ۵، تکنیکهای پاکسازی دادهها، شش جنبه حیاتی کیفیت دادهها را بررسی میکند و تکنیکهای مختلف برای تمیز کردن دادهها را به نمایش میگذارد، فرآیندی حیاتی برای افزایش کیفیت دادهها با اصلاح خطاها. ما نشان میدهیم که چرا پرسشکردن و بهبود سیستماتیک کیفیت دادهها برای سیستمهای یادگیری ماشینی قابلاعتماد حیاتی است، همگی در عین حال که مهارتهای ضروری تمیز کردن دادهها را به شما آموزش میدهند.
فصل ۶، تکنیکهای برچسبگذاری برنامهای در یادگیری ماشین، بر تکنیکهای برچسبگذاری برنامهای برای افزایش کیفیت داده و قدرت سیگنال تمرکز دارد. ما مزایا و معایب برچسبگذاری برنامهای را بررسی میکنیم و مثالهای عملی از نحوه اجرا و اعتبارسنجی این تکنیکها را ارائه میدهیم.
فصل ۷، استفاده از دادههای ترکیبی در یادگیری ماشین داده محور، دادههای مصنوعی را به عنوان روشی کارآمد و مقرون به صرفه برای غلبه بر محدودیتهای جمعآوری و برچسبگذاری دادههای سنتی معرفی میکند. در این فصل از کتاب Data-Centric Machine Learning with Python، شما یاد خواهید گرفت که دادههای مصنوعی چیست، چگونه برای بهبود مدلها استفاده میشود، تکنیکهای تولید آن و خطرات و چالشهای آن.
فصل ۸ از کتاب Data-Centric Machine Learning with Python، تکنیکهایی برای شناسایی و حذف سوگیری، بر مشکل سوگیری در نحوه جمعآوری دادهها، اعمال دادهها و مدلها برای یک مشکل، و سوگیری ذاتی انسانی که در بسیاری از مجموعههای داده ثبت شده است، تمرکز دارد. ما تکنیکهای داده محور را برای شناسایی و تصحیح سوگیریها به شیوهای اخلاقی مرور خواهیم کرد.
فصل ۹، برخورد با موارد لبه و رویدادهای نادر در یادگیری ماشین، روند تشخیص رویدادهای نادر در ML را توضیح میدهد. ما روشها و تکنیکهای مختلف را بررسی میکنیم، اهمیت معیارهای ارزیابی را مورد بحث قرار میدهیم و تأثیرات گسترده شناسایی رویدادهای نادر را نشان میدهیم.
فصل ۱۰، شروع سفر شما در یادگیری ماشین مبتنی بر داده، چالشهای فنی و غیرفنی را که ممکن است در طول توسعه و استقرار مدل با آن مواجه شوید، روشن میکند. این فصل آخر به شما نشان میدهد که چگونه یک رویکرد داده محور میتواند به شما در غلبه بر این چالشها کمک کند و فرصتهای بزرگی را برای رشد و استفاده گستردهتر از یادگیری ماشین در سازمان شما باز کند.
سرفصلهای کتاب Data-Centric Machine Learning with Python:
- Data-Centric Machine Learning with Python
- Foreword
- Contributors
- About the authors
- About the reviewers
- Preface
- Part 1: What Data-Centric Machine Learning Is and Why We Need It
- Chapter 1: Exploring Data-Centric Machine Learning
- Chapter 2: From Model-Centric to Data-Centric – ML’s Evolution
- Part 2: The Building Blocks of Data-Centric ML
- Chapter 3: Principles of Data-Centric ML
- Chapter 4: Data Labeling Is a Collaborative Process
- Part 3: Technical Approaches to Better Data
- Chapter 5: Techniques for Data Cleaning
- Chapter 6: Techniques for Programmatic Labeling in Machine Learning
- Chapter 7: Using Synthetic Data in Data-Centric Machine Learning
- Chapter 8: Techniques for Identifying and Removing Bias
- Chapter 9: Dealing with Edge Cases and Rare Events in Machine Learning
- Part 4: Getting Started with Data-Centric ML
- Chapter 10: Kick-Starting Your Journey in Data-Centric Machine Learning
- Index
- Other Books You May Enjoy
جهت دانلود کتاب Data-Centric Machine Learning with Python میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.