کتاب MLOps Engineering at Scale یا مهندسی عملگرهای یادگیری ماشین در مقیاس، از جدیدترین کتابهای حوزهی یادگیری ماشین است که در سال 2022 به چاپ رسیده است. این کتاب در 3 قسمت به آموزش مقدماتی تا پیشرفتهی MLOps خواهد پرداخت.
در ادامه مقدمهای از کتاب MLOps Engineering at Scale را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب MLOps Engineering at Scale:
یک بازخورد مفیدی که از یک منتقد این کتاب دریافت کردم این بود که برای آنها به یک “کد تقلب” تبدیل شد تا منحنی یادگیری MLOps را با شیب تند مقیاس کنند. امیدوارم که محتوای این کتاب به شما کمک کند تا به یک متخصص آگاه تر در زمینه مهندسی یادگیری ماشین و علم داده تبدیل شوید، و همچنین در پروژههای خود، تیم و سازمان خود مشارکت مولدتری داشته باشید.
در سال 2021، شرکتهای بزرگ فناوری در مورد تلاشهای خود برای «دموکراتیزه کردن» هوش مصنوعی (AI) با در دسترستر کردن فناوریهایی مانند یادگیری عمیق برای جمعیت وسیعتری از دانشمندان و مهندسان صحبت میکنند.
متأسفانه، رویکرد دموکراسیسازی که توسط شرکتها اتخاذ شده است، بیش از حد بر فناوریهای اصلی تمرکز دارد و به اندازه کافی بر روی تمرین ارائه سیستمهای هوش مصنوعی به کاربران نهایی تمرکز ندارد. در نتیجه، مهندسان و دانشمندان دادههای یادگیری ماشین (ML) برای ایجاد نمونههای آزمایشی و اثبات مفهوم هوش مصنوعی به خوبی آماده هستند، اما در ارائه موفقیتآمیز این نمونههای اولیه به تولید کوتاهی میکنند.
بیشتر بخوانید: کتاب Machine Learning Engineering in Action
این موضوع از طیف گستردهای از مسائل مشهود است: از میزان شکست غیرقابل قبول پروژههای هوش مصنوعی تا بحثهای اخلاقی در مورد سیستمهای هوش مصنوعی که آن را به کاربران نهایی تبدیل میکند. من معتقدم که برای موفقیت، تلاش برای دموکراتیزه کردن هوش مصنوعی باید فراتر از تمرکز نزدیک بینانه روی هسته پیشرفت کند و فناوریهایی مانند Keras، PyTorch و TensorFlow را فعال کند. MLO ها به عنوان یک اصطلاح متحد کننده برای تمرین گرفتن کد ML تجربی و اجرای موثر آن در تولید پدیدار شدند. ML بدون سرور، مدل توسعه نرمافزار بومی ابری پیشرو برای ML و MLOps است که زیرساختها را انتزاع میکند و بهرهوری پزشکان را بهبود میبخشد.
همچنین شما را تشویق میکنم از دفترچههای Jupyter که همراه این کتاب هستند استفاده کنید. پروژه کرایه تاکسی DC مورد استفاده در کد نوت بوک به گونه ای طراحی شده است که تمرینی را که برای رشد به عنوان یک تمرین کننده نیاز دارید به شما ارائه دهد. خواندن مبارک و کدنویسی شاد!
در مورد کتاب MLOps Engineering at Scale
چه کسی باید این کتاب را بخواند؟
برای به دست آوردن بیشترین ارزش از این کتاب، باید مهارتهای موجود در تجزیه و تحلیل دادهها با پایتون و SQL و همچنین تجربهای در زمینه یادگیری ماشین داشته باشید. من انتظار دارم که اگر در حال خواندن این کتاب هستید، علاقهمند به توسعه تخصص خود به عنوان یک مهندس یادگیری ماشین هستید و قصد دارید نمونههای اولیه مبتنی بر یادگیری ماشین خود را در تولید بکار ببرید.
کتاب MLOps Engineering at Scale برای متخصصان فناوری اطلاعات یا افرادی در دانشگاه است که تا حدی در معرض یادگیری ماشینی بودهاند و در حال کار بر روی راه اندازی یک سیستم یادگیری ماشینی در تولید هستند یا علاقه مند به راه اندازی آن هستند. در ضمیمه الف، مقدمهای درباره پیشنیازهای یادگیری ماشین برای این کتاب وجود دارد. به خاطر داشته باشید که اگر در یادگیری ماشین کاملاً تازه کار هستید، ممکن است متوجه شوید که مطالعه همزمان یادگیری ماشین و زیرساختهای مبتنی بر ابر برای یادگیری ماشین میتواند بسیار دشوار باشد.
اگر یک نرمافزار یا مهندس داده هستید و در حال برنامه ریزی برای شروع یک پروژه یادگیری ماشینی هستید، کتاب MLOps Engineering at Scale میتواند به شما کمک کند تا درک عمیق تری از چرخه عمر پروژه یادگیری ماشین کسب کنید.
خواهید دید که اگرچه تمرین یادگیری ماشین به فناوریهای اطلاعات سنتی (یعنی محاسبات، ذخیرهسازی و شبکه) بستگی دارد، اما در عمل با فناوری اطلاعات سنتی متفاوت است. مورد اول به طور قابل توجهی آزمایشی تر و تکراری تر از آن چیزی است که ممکن است به عنوان یک نرمافزار یا متخصص داده تجربه کرده باشید، و باید آمادگی داشته باشید که نتایج از قبل کمتر شناخته شوند.
هنگام کار با دادهها، تمرین یادگیری ماشین بیشتر شبیه فرآیند علمی است، از جمله تشکیل فرضیه در مورد دادهها، آزمایش مدلهای جایگزین برای پاسخ به سؤالات در مورد فرضیه، و رتبهبندی و انتخاب بهترین مدلها برای راهاندازی در بالای پلتفرم یادگیری ماشین شما.
اگر شما یک مهندس یا متخصص یادگیری ماشین یا یک دانشمند داده هستید، به خاطر داشته باشید که این کتاب برای اینکه شما را به یک محقق بهتر تبدیل کند نیست. این کتاب برای آموزش شما در مورد مرزهای علم در یادگیری ماشین نوشته نشده است.
کتاب MLOps Engineering at Scale همچنین سعی نخواهد کرد مبانی یادگیری ماشینی را مجدداً به شما بیاموزد، اگرچه ممکن است مطالب موجود در ضمیمه A را که هدف آن متخصصان فناوری اطلاعات است، مرجع مفیدی بیابید. در عوض، باید انتظار داشته باشید که از این کتاب برای تبدیل شدن به یک همکار ارزشمندتر در تیم یادگیری ماشین خود استفاده کنید.
کتاب MLOps Engineering at Scale به شما کمک میکند تا با آنچه قبلاً در مورد علم داده و یادگیری ماشین میدانید، کارهای بیشتری انجام دهید تا بتوانید مشارکتهای آماده برای استفاده را به پروژه یا سازمان خود ارائه دهید. به عنوان مثال، شما یاد خواهید گرفت که چگونه بینش خود را در مورد بهبود دقت مدل یادگیری ماشین پیاده سازی کنید و آنها را به قابلیتهای آماده تولید تبدیل کنید.
نحوه سازماندهی این کتاب: نقشه راه
کتاب MLOps Engineering at Scale از سه بخش تشکیل شده است. در قسمت 1، من چشم انداز آنچه را که برای قرار دادن یک سیستم یادگیری ماشین در تولید لازم است ترسیم میکنم، یک شکاف مهندسی بین کد یادگیری ماشین آزمایشی و سیستمهای یادگیری ماشین تولیدی را شرح می دهم و توضیح می دهم که چگونه یادگیری ماشین بدون سرور میتواند به پر کردن شکاف کمک کند.
در پایان قسمت 1 کتاب MLOps Engineering at Scale، من به شما یاد خواهم داد که چگونه از ویژگیهای بدون سرور یک ابر عمومی (سرویس وب آمازون) استفاده کنید تا با یک مورد استفاده از یادگیری ماشین در دنیای واقعی شروع کنید، مجموعه دادههای یادگیری ماشین کار را برای استفاده آماده کنید. مورد، و اطمینان حاصل کنید که برای اعمال یادگیری ماشین در مورد استفاده آماده هستید.
فصل 1 کتاب MLOps Engineering at Scale دیدگاه گسترده ای را در زمینه مهندسی سیستمهای یادگیری ماشین و آنچه برای قرار دادن سیستمها در تولید لازم است ارائه میدهد.
فصل 2 شما را با مجموعه دادههای سفرهای تاکسی برای شهرداری واشنگتن، دی سی، آشنا میکند و به شما میآموزد که چگونه از مجموعه دادهها برای یادگیری ماشینی در خدمات ابر عمومی آمازون (AWS) استفاده کنید.
فصل 3 کتاب MLOps Engineering at Scale سرویس پرس و جو تعاملی AWS Athena را برای کاوش بیشتر در مجموعه دادهها، کشف مشکلات کیفیت داده، و سپس رسیدگی به آنها از طریق یک فرآیند دقیق و اصولی تضمین کیفیت داده اعمال میکند.
فصل 4 نحوه استفاده از معیارهای آماری را برای خلاصه کردن نمونههای مجموعه دادهها و تعیین کمیت شباهت آنها به کل مجموعه داده نشان میدهد. این فصل همچنین نحوه انتخاب اندازه مناسب برای مجموعه دادههای تست، آموزش و اعتبارسنجی و استفاده از پردازش توزیعشده در ابر را برای آمادهسازی نمونههای مجموعه داده برای یادگیری ماشین پوشش میدهد.
در بخش 2 کتاب MLOps Engineering at Scale، من به شما آموزش میدهم که از چارچوب یادگیری عمیق PyTorch برای توسعه مدلهایی برای مجموعه دادههای ساختاریافته، توضیح میدهم که چگونه آموزش مدل یادگیری ماشین را در فضای ابری توزیع و مقیاس بندی کنید، و نحوه استقرار مدلهای یادگیری ماشین آموزش دیده را برای مقیاس بندی با تقاضای کاربر در این فرآیند، شما یاد خواهید گرفت که عملکرد پیادهسازیهای مدل یادگیری ماشین جایگزین را ارزیابی و ارزیابی کنید و چگونه مدل مناسب را برای مورد استفاده انتخاب کنید.
فصل 5 کتاب MLOps Engineering at Scale با معرفی رابط برنامهنویسی برنامه تانسور اصلی (API) و کمک به شما در به دست آوردن سطحی از تسلط با استفاده از API، اصول PyTorch را پوشش میدهد.
فصل 6 بر جنبههای یادگیری عمیق PyTorch، از جمله پشتیبانی از تمایز خودکار، الگوریتمهای نزولی گرادیان جایگزین، و ابزارهای پشتیبانی تمرکز دارد.
فصل 7 توضیح میدهد که چگونه برنامههای PyTorch خود را با آموزش در مورد ویژگیهای واحد پردازش گرافیکی (GPU) و نحوه استفاده از آنها برای تسریع کد یادگیری عمیق خود، افزایش دهید.
فصل 8 در مورد رویکردهای موازی داده برای آموزش توزیع شده PyTorch و پوششهای عمیق، تمایز بین رویکردهای سنتی، پارامتری، مبتنی بر سرور و آموزش توزیع شده مبتنی بر حلقه (به عنوان مثال، Horovod) را آموزش میدهد.
در قسمت 3 کتاب MLOps Engineering at Scale، شما را با تکنیکهای آزمایششده در نبرد تمرینکنندگان یادگیری ماشین و مهندسی ویژگی پوشش، تنظیم فراپارامتر و مونتاژ خط لوله یادگیری ماشین آشنا میکنم. با پایان این کتاب، شما یک پلتفرم یادگیری ماشینی راهاندازی خواهید کرد که دادههای خام را جذب میکند، آنها را برای یادگیری ماشین آماده میکند، مهندسی ویژگیها را اعمال میکند، و مدلهای یادگیری ماشینی با عملکرد بالا و تنظیمشده با فراپارامتر را آموزش میدهد.
فصل 9 موارد استفاده در مورد انتخاب ویژگی و مهندسی ویژگی را بررسی میکند، با استفاده از مطالعات موردی برای ایجاد شهود در مورد ویژگیهایی که میتوانند برای مجموعه داده تاکسی DC انتخاب یا مهندسی شوند.
فصل 10 کتاب MLOps Engineering at Scale نحوه حذف کد مهندسی دیگ بخار (Boilerplate Engineering) را در پیادهسازی مدل PyTorch تاکسی DC خود با اتخاذ چارچوبی به نام PyTorch Lightning آموزش میدهد. همچنین، این فصل از طریق مراحل مورد نیاز برای آموزش، اعتبارسنجی و آزمایش مدل یادگیری عمیق پیشرفته شما هدایت میشود.
فصل 11 مدل یادگیری عمیق شما را با یک چارچوب بهینهسازی ابرپارامتر منبع باز به نام Optuna ادغام میکند و به شما کمک میکند چندین مدل را بر اساس مقادیر فراپارامتر جایگزین آموزش دهید و سپس مدلهای آموزش دیده را بر اساس از دست دادن و عملکرد متریک آنها رتبهبندی کنید.
فصل 12 پیادهسازی مدل یادگیری عمیق شما را در یک ظرف داکر بستهبندی میکند تا آن را در مراحل مختلف کل خط لوله یادگیری ماشین اجرا کند، از مجموعه دادههای توسعه تا یک مدل آموزش دیده آماده برای استقرار تولید.
سرفصلهای کتاب MLOps Engineering at Scale:
- Copyright
- contents
- front matter
- Part 1 Mastering the data set
- 1 Introduction to serverless machine learning
- 2 Getting started with the data set
- 3 Exploring and preparing the data set
- 4 More exploratory data analysis and data preparation
- Part 2 PyTorch for serverless machine learning
- 5 Introducing PyTorch: Tensor basics
- 6 Core PyTorch: Autograd, optimizers, and utilities
- 7 Serverless machine learning at scale
- 8 Scaling out with distributed training
- Part 3 Serverless machine learning pipeline
- 9 Feature selection
- 10 Adopting PyTorch Lightning
- 11 Hyperparameter optimization
- 12 Machine learning pipeline
- Appendix A. Introduction to machine learning
- Appendix B. Getting started with Docker
- index
فایل کتاب MLOps Engineering at Scale را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.