کتاب Databricks ML in Action: Learn how Databricks supports the entire ML lifecycle end to end from data ingestion to the model deployment (Databricks ML در عمل: بیاموزید که چگونه Databricks از کل چرخه حیات ML از زمان دریافت داده تا استقرار مدل پشتیبانی میکند) جهت آشنایی شما در استفاده از Databricks برای علم داده، یادگیری ماشین و هوش مصنوعی در 2 بخش مختلف نگاشته شده است.
در ادامه مقدمهای از کتاب Databricks ML in Action را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Databricks ML in Action:
در این کتاب، متوجه خواهید شد که چه چیزی پلتفرم اطلاعاتی Databricks را به انتخابی مناسب برای راهحلهای یادگیری ماشینی سطح بالا تبدیل میکند. Databricks ML in Action نمونههای سرتاسری را با تصاویری عملی از اجرای پروژههای علم داده، یادگیری ماشین و هوش مصنوعی مولد در پلتفرم Databricks ارائه میکند. همانطور که یاد میگیرید به طور عملی آنها را در جریانهای کاری روزمره به کار بگیرید، در MLflow مدیریت شده Databricks، جستجویبرداری، AutoML، Unity Catalog و Model Serving تخصص پیدا خواهید کرد.
این کتاب Databricks نه تنها توضیحات دقیق کد را ارائه میدهد، بلکه وارد کردن یکپارچه کد را برای استفاده عملی تسهیل میکند. خواهید فهمید که چگونه از پلتفرم منبع باز Databricks برای تقویت یادگیری، تقویت مهارتها و افزایش بهره وری خود با منابع تکمیلی استفاده کنید. در پایان کتاب Databricks ML in Action، شما در استفاده از Databricks برای علم داده، یادگیری ماشین و هوش مصنوعی تسلط خواهید یافت و شما را قادر میسازد تا محصولات داده برجسته را ارائه دهید.
کتاب Databricks ML in Action برای چه کسی است؟
این کتاب برای مهندسین یادگیری ماشین، دانشمندان داده و مدیران فنی است که به دنبال تخصص عملی در پیادهسازی و استفاده از پلتفرم اطلاعاتی Databricks و معماری Lakehouse آن برای ایجاد محصولات داده هستند.
آنچه کتاب Databricks ML in Action پوشش میدهد:
فصل ۱، شروع و مفاهیم Lakehouse، تکنیکها و روشهای مختلف برای مهندسی داده و یادگیری ماشین را پوشش میدهد. هدف این نیست که بینشهایی را در مورد دادههایی که قبلاً دیده نشده است، آشکار کنیم. اگر اینطور بود، این یک مقاله دانشگاهی بود. در عوض، هدف این فصل استفاده از دادههای باز و رایگان برای نشان دادن فناوری پیشرفته و بهترین شیوهها است. شما هر مجموعه داده موجود در کتاب Databricks ML in Action را فهرست و شرح خواهید داد.
فصل ۲، طراحی آجرهای داده: روز اول، طراحی فضای کاری، مدلسازی شیوههای چرخه زندگی، قراردادهای نامگذاری، مواردی که در DBFS نباید قرار داده شوند و سایر موضوعات مقدماتی را پوشش میدهد. استفاده از پلتفرم Databricks ساده است.
با این حال، گزینههای زیادی برای پاسخگویی به نیازهای مختلف سازمانهای مختلف وجود دارد. در طول سالهایی که بهعنوان پیمانکار و زمانی که در Databricks بودم، تیمهایی را موفق و شکست میخوردم. من پویایی موفقیتآمیز و همچنین هر گونه پیکربندی که با این بینش در این فصل از کتاب Databricks ML in Action، همراه است را با شما به اشتراک خواهم گذاشت.
فصل ۳، ساختن لایه برنز، سفر داده شما را در پلتفرم Databricks DI با کاوش در اصول لایه برنز معماری مدالیون آغاز میکند. لایه برنز اولین گام در تبدیل دادههای شما برای پروژههای پایین دستی است و این فصل از کتاب Databricks ML in Action، بر روی ویژگیها و تکنیکهای Databricks که برای تبدیلهای لازم در دسترس دارید تمرکز میکند. ما با معرفی Auto Loader، ابزاری برای خودکارسازی دادهها، که میتوانید با یا بدون Delta Live Tables (DLT) برای درج و تغییر دادههای خود پیادهسازی کنید، به شما Auto Loader را معرفی میکنیم.
فصل ۴، آشنایی با دادههای شما، ویژگیهایی را در پلتفرم Databricks DI بررسی میکند که به بهبود و نظارت بر کیفیت دادهها و تسهیل کاوش دادهها کمک میکند. روشهای متعددی برای شناخت بهتر دادههای خود با Databricks وجود دارد.
ابتدا، نحوه نظارت بر کیفیت دادهها با DLT را پوشش میدهیم تا مشکلات کیفیت را زودتر تشخیص دهیم و از آلودگی کل خطوط لوله جلوگیری کنیم. ما اولین نگاه دقیق خود را بهمانیتورینگ Lakehouse خواهیم داشت، که به ما کمک میکند تغییرات دادهها را در طول زمان تجزیه و تحلیل کنیم و میتواند به ما در مورد تغییرات مربوط به ما هشدار دهد.
فصل ۵، مهندسی ویژگی در Databricks، از فصل ۴ کتاب Databricks ML in Action تبعیت میکند، جایی که ما از قدرت Databricks برای کاوش و اصلاح مجموعه دادههای خود استفاده کردیم تا در اجزای Databricks که گام بعدی را امکانپذیر میکند – مهندسی ویژگیها را بررسی کنیم.
ما با پوشش دادن Databricks Feature Engineering (DFE) در Unity Catalog شروع میکنیم تا به شما نشان دهیم چگونه میتوانید ویژگیهای مهندسی شده را با استفاده از Unity Catalog به طور مؤثر مدیریت کنید.
درک نحوه استفاده از DFE در UC برای ایجاد ویژگیهای قابل استفاده مجدد و سازگار در آموزش و استنتاج بسیار مهم است. سپس، یاد خواهید گرفت که چگونه از Structured Streaming برای محاسبه ویژگیهای یک جریان استفاده کنید، که به شما امکان میدهد ویژگیهای حالتی مورد نیاز برای مدلها را برای تصمیمگیری سریع ایجاد کنید.
فصل 6، ابزارهایی برای آموزش و آزمایش مدل، چگونگی استفاده از علم داده برای جستجوی سیگنال پنهان در نویز داده ها را بررسی می کند. ما از ویژگیهایی که در پلتفرم Databricks در فصل قبل ایجاد کردیم، استفاده خواهیم کرد. ما با استفاده از AutoML در یک رویکرد مدلسازی اولیه، ارائه کد تولید خودکار و به سرعت دانشمندان داده را قادر میسازیم تا یک مدل پایه را ایجاد کنند، شروع خواهیم کرد.
هنگام جستجوی سیگنال، ویژگیها، فراپارامترها و مدلهای مختلف را آزمایش میکنیم. از نظر تاریخی، ردیابی این پیکربندیها و معیارهای ارزیابی مربوط به آنها به خودی خود یک پروژه زمانبر است. مکانیزم ردیابی کم سربار، مانند ردیابی ارائه شده توسط MLflow، یک سکوی منبع باز برای مدیریت پروژه های علم داده و پشتیبانی از MLO ها، بار پیکربندی های دستی را کاهش می دهد. به طور خاص تر، ما MLflow Tracking را معرفی خواهیم کرد، یک جزء MLflow که به طور قابل توجهی ردیابی بسیاری از خروجی های هر جایگشت را بهبود می بخشد. با این حال، این تنها آغاز است.
فصل 7، تولید ML در Databricks، تولید یک مدل یادگیری ماشین را با استفاده از محصولات Databricks بررسی میکند، که با ترکیب عملکردهایی مانند Unity Catalog Registry، Databricks Workflow، Databricks Asset Bundles و Model Serving، سفر را سادهتر و منسجمتر میکند. این فصل از کتاب Databricks ML in Action، ابزارها و شیوههای انتقال مدلهای شما از توسعه به تولید را پوشش میدهد.
فصل 8، نظارت، ارزیابی و موارد دیگر، نحوه ایجاد تجسم برای داشبوردها در داشبوردهای Lakeview جدید و داشبوردهای استاندارد DBSQL را پوشش می دهد. مدل های مستقر شده را می توان از طریق یک برنامه وب به اشتراک گذاشت. بنابراین، ما نه تنها Hugging Face Spaces را معرفی می کنیم، بلکه چت ربات RAG را با استفاده از یک برنامه Gradio برای اعمال آنچه یاد گرفته ایم، به کار می بریم.
سرفصلهای کتاب Databricks ML in Action:
- Databricks ML in Action
- Contributors
- About the authors
- About the reviewers
- Preface
- Part 1: Overview of the Databricks Unified Data Intelligence Platform
- Chapter 1: Getting Started and Lakehouse Concepts
- Chapter 2: Designing Databricks: Day One
- Chapter 3: Building the Bronze Layer
- Part 2: Heavily Project Focused
- Chapter 4: Getting to Know Your Data
- Chapter 5: Feature Engineering on Databricks
- Chapter 6: Tools for Model Training and Experimenting
- Chapter 7: Productionizing ML on Databricks
- Chapter 8: Monitoring, Evaluating, and More
- Index
- Other Books You May Enjoy
جهت دانلود کتاب Databricks ML in Action میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.