کتاب Mastering Classification Algorithms for Machine Learning (تسلط بر الگوریتم‌های طبقه‌بندی برای یادگیری ماشینی: یاد بگیرید چگونه الگوریتم‌های طبقه‌بندی را برای راه‌حل‌های موثر یادگیری ماشین به کار ببرید.) از جدیدترین منابع یادگیری Machine Learning است که در 8 فصل الگوریتم‌های مربوط به آن را آموزش می‌دهد.

در ادامه مقدمه‌ای از کتاب Mastering Classification Algorithms for Machine Learning را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Mastering Classification Algorithms for Machine Learning:

ایجاد مدل‌هایی برای یادگیری ماشینی فرآیندی زمان‌بر است که شامل ساعت‌ها کار روی ماشین برای تنظیم مدل‌ها در مرحله آموزش است. هر مدل دارای یک پایه ریاضی است، به این معنی که قبل از رسیدن مدل نهایی، چندین ابرپارامتر باید تغییر داده شود. درک ریاضیات پشت هر مدل امکان فرموله کردن یک مکانیسم علمی برای آزمایش ترکیبات مختلف ابرپارامترها را فراهم می‌کند. همچنین، درک ریاضیات پشت مدل‌ها به درک چگونگی تنظیم فراپارامترهای مختلف کمک می‌کند تا مدل نسبتاً سریع همگرا شود.

جنبه دیگر این است که همه مدل‌ها برای همه انواع داده‌ها مناسب نیستند. برای درک اینکه کدام مدل می‌تواند برای ساخت یک مدل برای یک مجموعه داده معین مناسب باشد، باید فرمول ریاضی مدل‌ها را درک کرد.

به طور خلاصه، برای موفقیت در ساخت مدل‌های یادگیری ماشینی، درک فرمول‌های ریاضی حیاتی است. این کتاب جزئیات ریاضیات هر مدل یادگیری ماشینی را برای حل مسائل طبقه بندی ارائه می‌دهد.

کتاب Mastering Classification Algorithms for Machine Learning با مدل‌های ساده شروع می‌شود و به سراغ مدل‌های پیچیده پیشرفته می‌رود. یک الگوریتم دقیق با داده‌های نمایشی برای هر الگوریتم مورد بحث در کتاب ارائه شده است.

آخرین، اما نه کم اهمیت، هر فصل یک مشکل صنعت حل شده با استفاده از یادگیری ماشین را مورد بحث قرار می‌دهد. کتاب Mastering Classification Algorithms for Machine Learning استفاده از الگوریتم‌های طبقه‌بندی را برای حل تشخیص هرزنامه، تقسیم‌بندی مشتری، تشخیص بیماری، تشخیص بدافزار، تشخیص احساسات از گفتار و طبقه‌بندی تصویر مورد بحث قرار می‌دهد.

تمامی کدهای این کتاب به زبان پایتون نوشته شده است. پایتون محبوب‌ترین زبان برنامه‌نویسی برای علوم داده است. با این حال، کاربران سایر زبان‌های برنامه‌نویسی محبوب، از جمله R، Scala، و Octave، می‌توانند از این کتاب استفاده کنند زیرا ریاضیات مدل‌ها ثابت می‌ماند.

کتابخانه اصلی مورد استفاده در این کتاب Scikit-Learn است که تا حد زیادی محبوب ترین کتابخانه برای یادگیری ماشین است. در حالی که Scikit-Learn برای Python در این کتاب استفاده شده است، Scikit-Learn برای زبان R نیز موجود است. امیدوارم این کتاب برای شما آموزنده و مفید واقع شود.

فصل 1: مقدمه‌ای بر یادگیری ماشین – نحوه یادگیری ماشین‌ها را توضیح می‌دهد. این فصل از کتاب Mastering Classification Algorithms for Machine Learning نیاز به درک این نکته را ایجاد می‌کند که مدل‌های یادگیری ماشین اساساً فرمول‌های ریاضی هستند. انواع مختلفی از مشکلاتی که می‌توان با استفاده از یادگیری ماشین حل کرد مورد بحث قرار می‌گیرد. این فصل از مثال‌هایی برای بحث در مورد حل مشکلات رگرسیون، طبقه‌بندی، خوشه‌بندی و کاهش ابعاد استفاده می‌کند.

فصل 2: الگوریتم ساده بیز – بحث مفصلی از این الگوریتم ساده، در عین حال قدرتمند و محبوب ارائه می کند. الگوریتم ساده بیز یک مدل احتمالی است و این فصل مفاهیم احتمالی درگیر را مورد بحث قرار می‌دهد. از آنجایی که الگوریتم ساده بیز ساده‌سازی نظریه بیز است، این فصل نیاز به ساده‌سازی و پیامدهای ساده‌سازی را مورد بحث قرار می‌دهد. الگوریتم Naïve Bayes برای حل مشکل تشخیص هرزنامه استفاده می‌شود. این فصل از کتاب Mastering Classification Algorithms for Machine Learning با بحث در مورد معیارهای مختلف مورد استفاده برای ارزیابی یک مدل به پایان می‌رسد.

فصل 3: الگوریتم K-نزدیکترین همسایه – یک الگوریتم طبقه بندی ساده، در عین حال قدرتمند و محبوب دیگر را مورد بحث قرار می‌دهد. فرمول ریاضی این الگوریتم در این فصل به همراه تغییرات احتمالی مورد بحث قرار گرفته است. مشکل تقسیم بندی مشتری بر اساس تحلیل اخیر، فراوانی و ارزش پولی (RFM) با استفاده از الگوریتم KNN در این فصل حل شده است.

فصل 4: رگرسیون لجستیک پایه و اساس الگوریتم‌های پیچیده تر از جمله شبکه‌های عصبی است. این فصل از کتاب Mastering Classification Algorithms for Machine Learning از یک مثال ساده برای توضیح مفهوم Gradient Descent از طریق یک راهنما استفاده می کند.

مفاهیم توابع زیان و هزینه در این فصل مورد بحث قرار گرفته و در فصل‌های بعدی اعمال خواهد شد. رگرسیون لجستیک اساساً طبقه بندی باینری را انجام می‌دهد. این فصل از کتاب Mastering Classification Algorithms for Machine Learning به گسترش الگوریتم اصلی برای انجام طبقه‌بندی چند کلاسه می‌پردازد. این فصل با بحث در مورد چگونگی طبقه‌بندی نتیجه تشخیص پزشکی به پایان می‌رسد.

فصل 5: الگوریتم درخت تصمیم در ساخت بسیاری از الگوریتم‌های پیچیده‌تر استفاده می‌شود. بنابراین، درک الگوریتم درخت تصمیم حیاتی است. این فصل از طریق فرآیند ساخت درخت تصمیم با استفاده از شاخص جینی می‌پردازد. محاسبات گام‌به‌گام در این فرآیند نشان داده شده است.

این فصل با بحث در مورد چگونگی استفاده از الگوریتم درخت تصمیم برای شناسایی بدافزار در فایل‌های JPEG پایان می‌یابد. قبل از اعمال الگوریتم درخت تصمیم، باید بتوانیم اطلاعات را از فایل‌های JPEG استخراج کنیم و بتوانیم داده‌ها را طوری فرمول بندی کنیم که بتوان از آن برای اعمال الگوریتم یادگیری ماشینی بر روی آن استفاده کرد.

این فصل از کتاب Mastering Classification Algorithms for Machine Learning شامل بحثی است در مورد اینکه چگونه مجموعه داده‌های نامتعادل را می‌توان متعادل کرد. همچنین، این فصل در مورد چگونگی استفاده از تجزیه و تحلیل مؤلفه اصلی برای کاهش ابعاد داده بحث می‌کند.

فصل 6: مدل‌های گروهی – در مورد اینکه چند مدل ضعیف می‌توانند برای تشکیل یک مدل قوی ترکیب شوند، بحث می‌کند. این فصل همچنین نحوه فرمول بندی مدل‌های گروهی، از جمله مدل‌های Voting، Bagging، Boosting و Stacking را مورد بحث قرار می‌دهد.

این فصل از کتاب Mastering Classification Algorithms for Machine Learning با بحث در مورد چگونگی تشخیص احساسات از گفتار به پایان می‌رسد. برای اینکه بتوانیم این کار را انجام دهیم، این فصل نحوه استخراج و فرموله کردن اطلاعات از کلیپ‌های صوتی را برای استفاده در یک مدل یادگیری ماشین بحث می‌کند.

فصل 7: الگوریتم جنگل تصادفی یک الگوریتم قدرتمند و پیشرفته در یادگیری ماشین است. یک مورد خاص از مدل Bagging Ensemble می‌باشد. این فصل فرمول‌بندی الگوریتم جنگل تصادفی را مورد بحث قرار می‌دهد و اینکه چه چیزی مدل را از تعصب و واریانسی که به خوبی روی داده‌های واقعی کار می‌کند، آزاد می‌کند. کاربرد شناسایی بدافزار در فایل های ELF با استفاده از الگوریتم Random Forest مورد بحث قرار گرفته است.

فصل 8: الگوریتم تقویت یکی دیگر از الگوریتم‌های پیشرفته برای حل مسائل طبقه بندی است. این فصل از کتاب Mastering Classification Algorithms for Machine Learning با استفاده از یک مثال الگوریتم AdaBoost را طی می‌کند. الگوریتم AdaBoost در درجه اول از الگوریتم درخت تصمیم به عنوان هسته استفاده می‌کند.

بنابراین، الگوریتم درخت تصمیم دوباره در این فصل مورد بررسی قرار می‌گیرد. این فصل از کتاب Mastering Classification Algorithms for Machine Learning مشکل طبقه بندی تصاویر را با استفاده از الگوریتم AdaBoost حل می‌کند. از آنجایی که حتی الگوریتم قدرتمندی مانند AdaBoost نتایج رضایت بخشی را برای طبقه بندی ویدئو ایجاد نمی‌کند، فصل با معرفی شبکه‌های عصبی به پایان می‌رسد.

علاوه بر هشت فصل، کتاب دارای 8 ضمیمه برای تکمیل مباحث با مفاهیم لازم است.

پیوست 1: نوت بوک Jupyter یک محیط توسعه یکپارچه (IDE) است که برای توسعه و اجرای تمام کدهای مورد بحث در این کتاب استفاده می شود. فایل‌های حاوی تمامی کدهای مطرح شده در این کتاب به عنوان مطالب تکمیلی همراه با کتاب ارائه شده است. تمامی این کدها به صورت نوت بوک Jupyter هستند. این ضمیمه اصول اولیه نوت بوک Jupyter را مورد بحث قرار می‌دهد.

پیوست 2: پایتون زبان برنامه‌نویسی مورد استفاده در این کتاب است. این ضمیمه اصول برنامه‌نویسی پایتون را معرفی می‌کند.

پیوست 3: تجزیه ارزش منفرد یکی از روش‌های کاهش ابعاد داده‌ها است. این ضمیمه ریاضیات پشت تجزیه ارزش واحد (SVD) را مورد بحث قرار می‌دهد و کاربرد SVD را برای فشرده سازی تصویر نشان می‌دهد.

پیوست 4: پیش پردازش داده‌های متنی یکی از مراحل ضروری قبل از اعمال داده‌های متنی برای یادگیری ماشین است. این پیوست مراحل پیش پردازش ضروری برای پاکسازی داده‌های متنی را مورد بحث قرار می‌دهد.

پیوست 5: Stemming و Lamentation مکانیسم‌هایی هستند که در پیش پردازش داده‌های متنی به کار می‌روند. این پیوست هر دو این تکنیک‌ها را با مثال‌هایی مورد بحث قرار می‌دهد.

ضمیمه 6: بردارها برای تبدیل داده‌های متنی به اعداد برای استفاده در مدل‌های یادگیری ماشین استفاده می‌شوند. مدل‌های یادگیری ماشینی را می‌توان تنها با استفاده از داده‌های عددی ساخت و بنابراین، وجود مکانیزمی برای تبدیل داده‌های متنی به اعداد ضروری است. این پیوست دو بردار را مورد بحث قرار می‌دهد – Count Vectorizer و TF-IDF Vectorizer.

پیوست 7: رمزگذارها برای تبدیل داده‌های متنی به اعداد استفاده می‌شوند تا در مدل‌های یادگیری ماشین اعمال شوند. مدل‌های یادگیری ماشینی را می‌توان تنها با استفاده از داده‌های عددی ساخت و بنابراین، وجود مکانیزمی برای تبدیل داده‌های متنی به اعداد ضروری است. این ضمیمه رمزگذارهای مختلف را مورد بحث قرار می‌دهد.

پیوست 8: از آنتروپی در تشکیل درخت تصمیم استفاده می‌شود. در فصل 5 کتاب Mastering Classification Algorithms for Machine Learning چگونگی شکل گیری درختان تصمیم با استفاده از شاخص جینی بحث شد. این پیوست یک روش جایگزین برای تشکیل درخت تصمیم با استفاده از آنتروپی و به دست آوردن اطلاعات ارائه می‌دهد.

سرفصل‌های کتاب Mastering Classification Algorithms for Machine Learning:

Mastering Classification Algorithms for Machine Learning
About the Author
Acknowledgement
Preface
Table of Contents
1. Introduction to Machine Learning
2. Naïve Bayes Algorithm
3. K-Nearest Neighbor Algorithm
4. Logistic Regression
5. Decision Tree Algorithm
6. Ensemble Models
7. Random Forest Algorithm
8. Boosting Algorithm
Annexure 1: Jupyter Notebook
Annexure 2: Python
Annexure 3: Singular Value Decomposition
Annexure 4: Preprocessing Textual Data
Annexure 5: Stemming and Lamentation
Annexure 6: Vectorizers
Annexure 7: Encoders
Annexure 8: Entropy
Index

جهت دانلود کتاب Mastering Classification Algorithms for Machine Learning می‌توانید پس از پرداخت، دریافت کنید.

فرمت کتاب	PDF
ویرایش	First
ISBN	978-93-55518-514
تعداد صفحات	380
انتشارات	BPB Publications
سال انتشار	2023
حجم	18.84 مگابایت
نویسنده	Partha Majumdar

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب Mastering Classification Algorithms for Machine Learning”

کتاب Mastering Classification Algorithms for Machine Learning

خرید کتاب Mastering Classification Algorithms for Machine Learning:

مقدمه‌ای بر کتاب Mastering Classification Algorithms for Machine Learning:

سرفصل‌های کتاب Mastering Classification Algorithms for Machine Learning:

دیدگاهها

خرید کتاب Mastering Classification Algorithms for Machine Learning:

دسته‌یندی کتاب‌ها:

کتاب های پیشنهادی:

دسته بندی پیشنهادی

اعتبار ما: