کتاب Machine Learning for Tabular Data: XGBoost, Deep Learning, and AI (یادگیری ماشین برای دادههای جدولی: XGBoost، یادگیری عمیق و هوش مصنوعی) یک راهنمای عملی است که به شما نشان میدهد چگونه از تکنیکهای پیشرفته یادگیری ماشین، از جمله XGBoost، یادگیری عمیق و هوش مصنوعی مولد، برای استخراج بینشهای ارزشمند از دادههای جدولی استفاده کنید.
در ادامه مقدمهای از کتاب Machine Learning for Tabular Data را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Machine Learning for Tabular Data:
این کتاب تقاطع دو موضوعی را پوشش میدهد که ما به آنها علاقه زیادی داریم: یادگیری ماشین و دادههای جدولی. ما اهمیت دادههای جدولی را درک میکنیم—یعنی دادههایی در ردیفها و ستونها که در مخازن متنوعی قرار دارند، از صفحهگستردههای ساده گرفته تا پیچیدهترین پایگاههای داده رابطهای.
حتی با موج عظیم دادههای غیرجدولی در دو دهه گذشته، تقریباً هر کسبوکار و دولتی در این سیاره به دادههای جدولی وابسته است. زمانی که مانینگ به ما پیشنهاد فرصت نوشتن کتابی برای توصیف جدیدترین تکنیکهای تحلیل دادههای جدولی با یادگیری ماشین، شامل هر دو روش کلاسیک مانند گرادیان بوستینگ و یادگیری عمیق را داد، نتوانستیم آن را رد کنیم. زمانی که انقلاب هوش مصنوعی مولد در طول توسعه این کتاب به اوج خود رسید، ما از فرصت گنجاندن هوش مصنوعی مولد در روایت کتاب استقبال کردیم.
امیدواریم کتاب ما به شما توصیههای عملی و رویکردهای ملموسی ارائه دهد تا بتوانید در مورد تقاطع این دو موضوع حیاتی—یادگیری ماشین و دادههای جدولی—بیشتر بیاموزید.
درباره کتاب Machine Learning for Tabular Data
این کتاب توضیح میدهد که چگونه میتوانید از رویکردهای یادگیری ماشین، از جمله رویکردهای کلاسیک مبتنی بر گرادیان بوستینگ، یادگیری عمیق و هوش مصنوعی مولد، برای استخراج بینشهای ارزشمند از دادههای جدولی (دادههای ساختاریافته سازماندهی شده در ردیفها و ستونها) استفاده کنید که میتوانید در کار خود به کار ببرید.
شما در مورد ویژگیهای تعیینکننده دادههای جدولی، بهترین روشها برای اعمال یادگیری ماشین در دادههای جدولی و نحوه در دسترس قرار دادن مدلی که روی دادههای جدولی آموزش دادهاید برای استفاده دیگران، خواهید آموخت.
همچنین مزایا و معایب یادگیری ماشین کلاسیک و یادگیری عمیق را هنگام حل مسائل دادههای جدولی خواهید آموخت. در سراسر کتاب Machine Learning for Tabular Data، با استفاده از هوش مصنوعی مولد، فرآیند تجزیه و تحلیل را تسریع خواهید کرد.
چه کسی باید کتاب Machine Learning for Tabular Data را بخواند؟
این کتاب برای مخاطبانی است که شامل دانشمندان داده، مهندسان هوش مصنوعی/یادگیری ماشین و ذینفعان تجاری میشود. برای بهرهمندی حداکثری از این کتاب، باید پایهای در تکنیکهای یادگیری ماشین کلاسیک و آشنایی با یادگیری عمیق داشته باشید. مثالهای کد که در سراسر کتاب Machine Learning for Tabular Data ظاهر میشوند از پایتون استفاده میکنند و بیشتر آنها برای اجرا در محیطهای میزبانی شده Jupyter Notebook مانند Google Colab طراحی شدهاند.
اگر قبلاً با روشهای استاندارد پایتون برای کار با دادههای جدولی مانند بستههای pandas و NumPy آشنایی داشتهاید، بیشترین بهره را از این مثالهای کد خواهید برد. علاوه بر مثالهای مستقل که برای اجرا در Jupyter Notebooks طراحی شدهاند، فصلهای 10 و 11 شامل مثالهایی هستند که در محیط Google Cloud اجرا میشوند.
برای لذت بردن از این مثالها نیازی به دانستن Google Cloud ندارید—ما از ابتدا هر آنچه را که باید بدانید به شما خواهیم گفت—اما اگر قبلاً در یکی از محیطهای ابری اصلی (AWS، Azure یا Google Cloud) کار کردهاید، در مثالهای این دو فصل یک قدم جلوتر خواهید بود.
نحوه سازماندهی کتاب Machine Learning for Tabular Data: نقشه راه
کتاب “یادگیری ماشین برای دادههای جدولی” دارای 12 فصل است که در سه بخش سازماندهی شدهاند.
بخش 1 کتاب Machine Learning for Tabular Data مفاهیم اساسی دادههای جدولی را معرفی میکند و رویکردهای برخورد با دادههای جدولی را مقایسه میکند:
- فصل 1 دادههای جدولی را تعریف میکند و دو رویکرد برای پیشبینی بر اساس دادههای جدولی را معرفی میکند.
- فصل 2 ویژگیهای تعیینکننده دادههای جدولی و مفاهیم کلیدی برای بررسی یک مجموعه داده جدولی معین را توصیف میکند.
- فصل 3 نقاط قوت و ضعف نسبی یادگیری ماشین کلاسیک و یادگیری عمیق را هنگام برخورد با دادههای جدولی مقایسه میکند.
بخش 2 کتاب Machine Learning for Tabular Data رویکردهای یادگیری ماشین کلاسیک موجود را توصیف میکند و به طور خاص توضیح میدهد که چگونه از یک تکنیک گرادیان بوستینگ، XGBoost، برای کسب نتایج مطلوب استفاده کنید:
- فصل 4 به شما نشان میدهد که چگونه از الگوریتمهای یادگیری ماشین کلاسیک برای پیشبینی بر اساس مجموعههای داده جدولی استفاده کنید.
- فصل 5 رویکرد اصلی یادگیری ماشین با دادههای جدولی را توصیف میکند: روشهای مبتنی بر درخت و به ویژه گرادیان بوستینگ.
- فصل 6 توضیح میدهد که چگونه با بهینهسازی آمادهسازی و انتخاب ویژگیها و با بهینهسازی ابرپارامترهایی که فرآیند آموزش مدل را کنترل میکنند، بیشترین بهره را از رویکردهای یادگیری ماشین کلاسیک، به ویژه گرادیان بوستینگ، ببرید.
- فصل 7 فرآیند کامل اعمال یکی از رویکردهای گرادیان بوستینگ، XGBoost، به یک مجموعه داده جدولی چالشبرانگیز را به شما نشان میدهد.
بخش 3 کتاب Machine Learning for Tabular Data به شما نشان میدهد که چگونه یک مدل یادگیری عمیق را با دادههای جدولی آموزش دهید، چگونه یک مدل آموزشدیده را مستقر کنید و چگونه یادگیری عمیق در مقایسه با یک رویکرد یادگیری ماشین کلاسیک در یک مقایسه برابر عمل میکند:
- فصل 8 پشتههای نرمافزاری مختلف موجود برای اعمال یادگیری عمیق در دادههای جدولی را توصیف میکند و نقاط قوت و ضعف پشتهها را خلاصه میکند.
- فصل 9 از یک مثال کدنویسی برای نشان دادن نکات و ترفندهای کلیدی برای بهرهمندی حداکثری از برنامههای یادگیری عمیق آموزشدیده با دادههای جدولی استفاده میکند.
- فصل 10 به شما نشان میدهد که چگونه مدلی را که در فصل 9 آموزش دادهاید در یک برنامه وب ساده که از یک ماشین محلی ارائه میشود ادغام کنید و چگونه همان مدل را در یک محیط ابری مدیریت شده محبوب، Google Cloud، مستقر کنید.
- فصل 11 به شما نشان میدهد که چگونه مراحل آموزش و استقرار مدل را با استفاده از امکانات خط لوله یادگیری ماشین Vertex AI در Google Cloud خودکار کنید، و همچنین چگونه میتوانید از هوش مصنوعی مولد برای سادهسازی وظیفه ایجاد یک خط لوله یادگیری ماشین استفاده کنید.
- فصل 12 کل کتاب را با هم پیوند میدهد و رویکرد گرادیان بوستینگ از فصل 7 را با یک رویکرد یادگیری عمیق مقایسه میکند و به شما نشان میدهد که چگونه با ترکیب این دو رویکرد به نتایج مطلوب برسید.
- در نهایت، دو پیوست جنبههایی را که امکان نمایش کامل و دقیق آنها در فصلها وجود نداشت، از نزدیک بررسی میکنند. پیوست A مروری بر ابرپارامترهای کلیدی مورد استفاده توسط هر الگوریتم یادگیری ماشین کلاسیک که در کتاب Machine Learning for Tabular Data مورد بحث قرار گرفته است، ارائه میدهد و مقادیر معمولی را برای آزمایش توسط روشهای بهینهسازی ارائه میکند. پیوست B به الگوریتم k-نزدیکترین همسایهها و ماشینهای بردار پشتیبان میپردازد، دو الگوریتم یادگیری ماشین کلاسیک که اخیراً به لطف رویکردها و ابزارهای جدید، مانند کتابخانه NVIDIA RAPIDS که از پردازندههای گرافیکی برای سرعت بخشیدن به اجرای الگوریتم استفاده میکند، شاهد افزایش استفاده بودهاند.
اگر علاقهمند به یادگیری هر دو رویکرد اصلی برای برخورد با دادههای جدولی (یادگیری ماشین کلاسیک و یادگیری عمیق) هستید، توصیه میکنیم فصلها را به ترتیب بخوانید. اگر عمدتاً به رویکردهای یادگیری ماشین کلاسیک علاقهمند هستید، پیشنهاد میکنیم بخش 1، بخش 2 و فصل 12 را بخوانید. اگر عمدتاً به رویکردهای یادگیری عمیق علاقهمند هستید، پیشنهاد میکنیم بخش 1 و سپس بخش 3 را بخوانید.
سرفصلهای کتاب Machine Learning for Tabular Data:
- Machine Learning for Tabular Data
- Copyright
dedication - contents
- front matter
- Part 1. Introducing machine learning for tabular data
- 1 Understanding tabular data
- 2 Exploring tabular datasets
- 3 Machine learning vs. deep learning
- Part 2. Machine learning and gradient boosting for tabular data
- 4 Classical algorithms for tabular data
- 5 Decision trees and gradient boosting
- 6 Advanced feature processing methods
- 7 An end-to-end example using XGBoost
- Part 3. Deep learning for tabular data
- 8 Getting started with deep learning with tabular data
- 9 Deep learning best practices
- 10 Model deployment
- 11 Building a machine learning pipeline
- 12 Blending gradient boosting and deep learning
- Appendix A. Hyperparameters for classical machine learning models
- Appendix B. K-nearest neighbors and support vector machines
- index
جهت دانلود کتاب Machine Learning for Tabular Data میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.