کتاب The Kaggle Book: Master data science competitions with machine learning, GenAI, and LLMs 2nd Edition (کتاب Kaggle: تسلط بر مسابقات علم داده با یادگیری ماشین، هوش مصنوعی مولد (GenAI) و مدلهای زبانی بزرگ (LLMها) – ویرایش دوم) راهنمایی عملی و جامع برای موفقیت در مسابقات Kaggle و سایر رقابتهای علم داده است که با تکیه بر تجربهی نویسندگان و گفتوگو با Kaggle Masterها و Grandmasterها نوشته شده است. این کتاب بهجای آموزش مفاهیم پایه، بر استراتژیهای مؤثر مسابقات، طراحی اعتبارسنجی صحیح، انتخاب و ترکیب مدلها، بهینهسازی ابرپارامترها و استفادهی حرفهای از امکانات Kaggle تمرکز دارد و در ویرایش دوم خود، مباحث جدیدی مانند هوش مصنوعی مولد، AutoML و کار با مدلهای زبانی بزرگ (LLMها) را نیز پوشش میدهد.
در ادامه مقدمهای از کتاب The Kaggle Book را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب The Kaggle Book:
با سالها حضور در رقابتهای Kaggle، فراز و نشیبهای بسیاری را در مسابقات مختلف تجربه کردهایم. در طول این مسیر طولانی، بارها پیش آمده که تمرکز خود را روی فعالیتهای گوناگونی مرتبط با Kaggle تغییر دهیم. بهمرور زمان، ما نهتنها خود را وقف مسابقات کردیم، بلکه به تولید محتوا و کدنویسی نیز پرداختیم؛ آن هم بر اساس نیازهای بازار علم داده و اهداف حرفهای خودمان.
پس از مدتی از این مسیر، به این احساس رسیدیم که تجربهی مشترک ما و اشتیاقی که هنوز نسبت به مسابقات در وجودمان زنده است، میتواند واقعاً به سایر شرکتکنندگان—بهویژه کسانی که تازه شروع کردهاند یا به دنبال الهام گرفتن و تصمیمگیری برای آغاز هستند—کمک کند؛ با فراهم کردن دسترسی آنها به دانش و مهارتهای اساسی لازم برای شروع مسیرشان در مسابقات علم داده.
در نتیجه، تصمیم گرفتیم روی کتابی دربارهی Kaggle با این هدف کار کنیم:
- ارائهی بهترین نکات برای رقابتی بودن و مواجهه با بیشتر مسائلی که هنگام شرکت در Kaggle و سایر مسابقات علم داده با آنها روبهرو میشوید، در یک منبع واحد
- ارائهی پیشنهادهای کافی تا هر کسی بتواند دستکم به سطح Expert در هر یک از حوزههای Kaggle (مسابقات، دیتاستها، نوتبوکها یا بحثها) برسد
- ارائهی نکاتی دربارهی اینکه چگونه بیشترین بهره را از Kaggle ببرید و از این تجربه برای رشد حرفهای در علم داده استفاده کنید
- گردآوری مهمترین دیدگاهها دربارهی تجربهی شرکت در مسابقات، از طریق مصاحبه با Kaggle Masterها و Grandmasterها و شنیدن داستانها و توصیههای آنها، در یک منبع واحد
بهطور خلاصه، ما کتابی نوشتهایم که نشان میدهد چگونه میتوان با موفقیت در مسابقات شرکت کرد و از تمام فرصتهایی که Kaggle ارائه میدهد بهره برد.
در اینجا، ویرایش دوم کتاب The Kaggle Book را با فصلها و محتوای بهروزشده ارائه میکنیم. هدف این ویرایش، ارائهی کمک بیشتر در چشماندازی در حال تحول است؛ جایی که در کنار مسابقات جاافتادهی دادههای جدولی، سریهای زمانی، بینایی ماشین و NLP، تعداد روبهرشدی از مسابقات پیرامون AutoML و مدلهای زبانی بزرگ (LLMها) شکل گرفتهاند. این مسابقات جدید مبتنی بر LLM به مهارتهایی در زمینهی فاینتیون کردن مدلهایی مانند Llama، Mistral، Gemma، Qwen و DeepSeek برای وظایف خاص نیاز دارند.
مانند ویرایش قبلی، این کتاب همچنین بهعنوان یک مرجع عملی طراحی شده تا با ارائهی مجموعهای از نکات و ترفندهای مسابقات—که یادگیری و یافتن آنها در اینترنت یا فرومهای Kaggle دشوار است—در زمان و انرژی شما صرفهجویی کند.
با این حال، کتاب صرفاً به ارائهی کمکهای عملی محدود نمیشود؛ بلکه تلاش میکند به شما کمک کند بفهمید چگونه میتوانید با شرکت در مسابقات، مسیر شغلی خود در علم داده را تقویت کنید.
توجه داشته باشید که کتاب The Kaggle Book علم داده را از پایه آموزش نمیدهد. ما توضیحات مفصلی دربارهی رگرسیون خطی، جنگلهای تصادفی یا توابع گرادیان بوستینگ ارائه نمیکنیم. در عوض، تمرکز ما بر این است که چگونه از این روشها بهطور مؤثر استفاده کنید تا بهترین نتایج را در مسائل دادهمحور به دست آورید. انتظار داریم خوانندگان ما پایهی محکمی در مباحث علم داده داشته باشند و حداقل با زبان Python در سطح مقدماتی آشنا باشند.
اگر هنوز در ابتدای مسیر علم داده هستید، لازم است این کتاب را با سایر کتابهای علم داده، یادگیری ماشین و یادگیری عمیق تکمیل کنید و در دورههای آنلاین—مانند دورههای ارائهشده توسط خود Kaggle یا دورههای آزاد گسترده (MOOC) مانند edX یا Coursera—تمرین و آموزش ببینید.
اگر میخواهید دانش علم دادهی خود را بهصورت عملی و از طریق تجربهی دستاول تقویت کنید، خود را با مسائل دادهای جذاب به چالش بکشید و همزمان شبکهای از دانشمندان دادهی هماشتیاق با خودتان بسازید، پس این کتاب دقیقاً برای شماست.
خب، شروع کنیم!
کتاب The Kaggle Book برای چه کسانی است؟
در زمان تکمیل این ویرایش جدید، ۱۲۲٬۳۸۸ کاربر تازهوارد Kaggle (کاربرانی که بهتازگی در وبسایت ثبتنام کردهاند) و ۶۷٬۹۲۴ مشارکتکنندهی Kaggle (کاربرانی که پروفایل خود را تکمیل کرده و حداقل یک ارسال به مسابقه داشتهاند) در رتبهبندی مسابقات Kaggle ثبت شده بودند. این کتاب برای همهی آنها و همچنین برای هر کسی که میخواهد یخ شروع را بشکند و شرکت در مسابقات Kaggle را آغاز کرده و از آنها یاد بگیرد، نوشته شده است.
کتاب The Kaggle Book چه مباحثی را پوشش میدهد
فصل ۱: معرفی Kaggle و سایر مسابقات علم داده
بررسی میکند که چگونه برنامهنویسی رقابتی به مسابقات علم داده تکامل یافت، چرا Kaggle محبوبترین پلتفرم این حوزه است و این پلتفرم چگونه کار میکند.
فصل ۲ کتاب The Kaggle Book: سازماندهی دادهها با Datasets
شما را با Kaggle Datasets، روش استاندارد ذخیرهسازی داده در این پلتفرم، آشنا میکند و به جمعآوری، تنظیم و استفاده از دادهها میپردازد.
فصل ۳: کار و یادگیری با Kaggle Notebooks
به معرفی نوتبوکها بهعنوان محیط پایهی کدنویسی میپردازد و نحوهی استفاده از آنها، بهرهگیری از محیط GCP و ساخت پورتفولیوی علم داده را توضیح میدهد.
فصل ۴: Kaggle Models
ویژگی جدید آپلود مدلها را معرفی میکند و نحوهی کشف، استفاده و بهاشتراکگذاری مدلهای ازپیشآموزشدیده را توضیح میدهد، بهویژه برای وظایف پیچیدهای مانند NLP و بینایی ماشین.
فصل ۵ کتاب The Kaggle Book: بهرهگیری از فرومهای گفتگو
شما را با فرومهای بحث، بهعنوان اصلیترین بستر ارتباط و تبادل ایده در Kaggle، آشنا میکند.
فصل ۶: وظایف مسابقات و معیارهای ارزیابی
نشان میدهد که معیارهای ارزیابی چگونه بهشدت بر نحوهی ساخت مدل شما تأثیر میگذارند و تنوع بالای این معیارها را بررسی میکند.
فصل ۷ کتاب The Kaggle Book: طراحی اعتبارسنجی مناسب
اهمیت اعتبارسنجی را توضیح میدهد و به مفاهیمی مانند overfitting، shake-up، leakage، اعتبارسنجی خصمانه، انواع استراتژیهای اعتبارسنجی و ارسال نهایی میپردازد.
فصل ۸ کتاب The Kaggle Book: مدلسازی برای مسابقات جدولی
به مسابقات دادههای جدولی—بهویژه Tabular Playground Series—میپردازد و درسهای مهمی که میتوان از آنها آموخت را بررسی میکند.
فصل ۹ کتاب The Kaggle Book: بهینهسازی ابرپارامترها
نشان میدهد چگونه میتوان اعتبارسنجی متقاطع را برای یافتن بهترین ابرپارامترها در شرایط محدودیت زمان و منابع گسترش داد.
فصل ۱۰: Ensemble با Blending و Stacking
تکنیکهای ensemble مانند میانگینگیری، blending و stacking را همراه با مبانی نظری، مثالهای عملی و کد ارائه میکند.
فصل ۱۱ کتاب The Kaggle Book: مدلسازی برای بینایی ماشین
خط لولههای کامل برای مسائل طبقهبندی تصویر، تشخیص اشیا و بخشبندی تصویر را نشان میدهد.
فصل ۱۲ کتاب The Kaggle Book: مدلسازی برای NLP
به چالشهای رایج پردازش زبان طبیعی در Kaggle میپردازد و راهحلهای انتهابهانتها را توضیح میدهد.
فصل ۱۳: هوش مصنوعی مولد در مسابقات Kaggle
حوزهی روبهرشد مسابقات هوش مصنوعی مولد را بررسی کرده و به فاینتیون، مهندسی پرامپت و ارزیابی خروجیها میپردازد.
فصل ۱۴: مسابقات شبیهسازی و بهینهسازی
مروری بر مسابقات شبیهسازی که در سالهای اخیر محبوب شدهاند ارائه میدهد.
فصل ۱۵: ساخت پورتفولیوی پروژهها و ایدهها
راههایی برای متمایز شدن از طریق نمایش درست کارها در Kaggle و سایر پلتفرمها ارائه میکند.
فصل ۱۶: یافتن فرصتهای شغلی جدید
با بررسی بهترین روشهای استفاده از تجربهی Kaggle، نشان میدهد چگونه این پلتفرم میتواند تأثیر مثبتی بر مسیر شغلی شما داشته باشد.
سرفصلهای کتاب The Kaggle Book:
- Preface
- Part 1: Your Kaggle Launchpad: Mastering the Essentials
- Introducing Kaggle and Other Data Science Competitions
- Organizing Data with Datasets
- Working and Learning with Kaggle Notebooks
- Kaggle Models
- Leveraging Discussion Forums
- Part 2: Elevating Your Game: Advanced Techniques for Competitive Success
- Competition Tasks and Metrics
- Designing Good Validation
- Modeling for Tabular Competitions
- Hyperparameter Optimization
- Ensembling with Blending and Stacking Solutions
- Modeling for Computer Vision
- Modeling for NLP
- Generative AI in Kaggle Competitions
- Simulation and Optimization Competitions
- Part 3: Kaggle for Your Career: Building Your Profile and Finding Opportunities
- Creating Your Portfolio of Projects and Ideas
- Finding New Professional Opportunities
- Unlock Your Exclusive Benefits
- Other Books You May Enjoy
- Index
جهت دانلود کتاب The Kaggle Book میتوانید پس از پرداخت، دریافت کنید.

دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.