کتاب Mastering Classification Algorithms for Machine Learning (تسلط بر الگوریتمهای طبقهبندی برای یادگیری ماشینی: یاد بگیرید چگونه الگوریتمهای طبقهبندی را برای راهحلهای موثر یادگیری ماشین به کار ببرید.) از جدیدترین منابع یادگیری Machine Learning است که در 8 فصل الگوریتمهای مربوط به آن را آموزش میدهد.
در ادامه مقدمهای از کتاب Mastering Classification Algorithms for Machine Learning را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Mastering Classification Algorithms for Machine Learning:
ایجاد مدلهایی برای یادگیری ماشینی فرآیندی زمانبر است که شامل ساعتها کار روی ماشین برای تنظیم مدلها در مرحله آموزش است. هر مدل دارای یک پایه ریاضی است، به این معنی که قبل از رسیدن مدل نهایی، چندین ابرپارامتر باید تغییر داده شود. درک ریاضیات پشت هر مدل امکان فرموله کردن یک مکانیسم علمی برای آزمایش ترکیبات مختلف ابرپارامترها را فراهم میکند. همچنین، درک ریاضیات پشت مدلها به درک چگونگی تنظیم فراپارامترهای مختلف کمک میکند تا مدل نسبتاً سریع همگرا شود.
جنبه دیگر این است که همه مدلها برای همه انواع دادهها مناسب نیستند. برای درک اینکه کدام مدل میتواند برای ساخت یک مدل برای یک مجموعه داده معین مناسب باشد، باید فرمول ریاضی مدلها را درک کرد.
به طور خلاصه، برای موفقیت در ساخت مدلهای یادگیری ماشینی، درک فرمولهای ریاضی حیاتی است. این کتاب جزئیات ریاضیات هر مدل یادگیری ماشینی را برای حل مسائل طبقه بندی ارائه میدهد.
کتاب Mastering Classification Algorithms for Machine Learning با مدلهای ساده شروع میشود و به سراغ مدلهای پیچیده پیشرفته میرود. یک الگوریتم دقیق با دادههای نمایشی برای هر الگوریتم مورد بحث در کتاب ارائه شده است.
آخرین، اما نه کم اهمیت، هر فصل یک مشکل صنعت حل شده با استفاده از یادگیری ماشین را مورد بحث قرار میدهد. کتاب Mastering Classification Algorithms for Machine Learning استفاده از الگوریتمهای طبقهبندی را برای حل تشخیص هرزنامه، تقسیمبندی مشتری، تشخیص بیماری، تشخیص بدافزار، تشخیص احساسات از گفتار و طبقهبندی تصویر مورد بحث قرار میدهد.
تمامی کدهای این کتاب به زبان پایتون نوشته شده است. پایتون محبوبترین زبان برنامهنویسی برای علوم داده است. با این حال، کاربران سایر زبانهای برنامهنویسی محبوب، از جمله R، Scala، و Octave، میتوانند از این کتاب استفاده کنند زیرا ریاضیات مدلها ثابت میماند.
کتابخانه اصلی مورد استفاده در این کتاب Scikit-Learn است که تا حد زیادی محبوب ترین کتابخانه برای یادگیری ماشین است. در حالی که Scikit-Learn برای Python در این کتاب استفاده شده است، Scikit-Learn برای زبان R نیز موجود است. امیدوارم این کتاب برای شما آموزنده و مفید واقع شود.
فصل 1: مقدمهای بر یادگیری ماشین – نحوه یادگیری ماشینها را توضیح میدهد. این فصل از کتاب Mastering Classification Algorithms for Machine Learning نیاز به درک این نکته را ایجاد میکند که مدلهای یادگیری ماشین اساساً فرمولهای ریاضی هستند. انواع مختلفی از مشکلاتی که میتوان با استفاده از یادگیری ماشین حل کرد مورد بحث قرار میگیرد. این فصل از مثالهایی برای بحث در مورد حل مشکلات رگرسیون، طبقهبندی، خوشهبندی و کاهش ابعاد استفاده میکند.
فصل 2: الگوریتم ساده بیز – بحث مفصلی از این الگوریتم ساده، در عین حال قدرتمند و محبوب ارائه می کند. الگوریتم ساده بیز یک مدل احتمالی است و این فصل مفاهیم احتمالی درگیر را مورد بحث قرار میدهد. از آنجایی که الگوریتم ساده بیز سادهسازی نظریه بیز است، این فصل نیاز به سادهسازی و پیامدهای سادهسازی را مورد بحث قرار میدهد. الگوریتم Naïve Bayes برای حل مشکل تشخیص هرزنامه استفاده میشود. این فصل از کتاب Mastering Classification Algorithms for Machine Learning با بحث در مورد معیارهای مختلف مورد استفاده برای ارزیابی یک مدل به پایان میرسد.
فصل 3: الگوریتم K-نزدیکترین همسایه – یک الگوریتم طبقه بندی ساده، در عین حال قدرتمند و محبوب دیگر را مورد بحث قرار میدهد. فرمول ریاضی این الگوریتم در این فصل به همراه تغییرات احتمالی مورد بحث قرار گرفته است. مشکل تقسیم بندی مشتری بر اساس تحلیل اخیر، فراوانی و ارزش پولی (RFM) با استفاده از الگوریتم KNN در این فصل حل شده است.
فصل 4: رگرسیون لجستیک پایه و اساس الگوریتمهای پیچیده تر از جمله شبکههای عصبی است. این فصل از کتاب Mastering Classification Algorithms for Machine Learning از یک مثال ساده برای توضیح مفهوم Gradient Descent از طریق یک راهنما استفاده می کند.
مفاهیم توابع زیان و هزینه در این فصل مورد بحث قرار گرفته و در فصلهای بعدی اعمال خواهد شد. رگرسیون لجستیک اساساً طبقه بندی باینری را انجام میدهد. این فصل از کتاب Mastering Classification Algorithms for Machine Learning به گسترش الگوریتم اصلی برای انجام طبقهبندی چند کلاسه میپردازد. این فصل با بحث در مورد چگونگی طبقهبندی نتیجه تشخیص پزشکی به پایان میرسد.
فصل 5: الگوریتم درخت تصمیم در ساخت بسیاری از الگوریتمهای پیچیدهتر استفاده میشود. بنابراین، درک الگوریتم درخت تصمیم حیاتی است. این فصل از طریق فرآیند ساخت درخت تصمیم با استفاده از شاخص جینی میپردازد. محاسبات گامبهگام در این فرآیند نشان داده شده است.
این فصل با بحث در مورد چگونگی استفاده از الگوریتم درخت تصمیم برای شناسایی بدافزار در فایلهای JPEG پایان مییابد. قبل از اعمال الگوریتم درخت تصمیم، باید بتوانیم اطلاعات را از فایلهای JPEG استخراج کنیم و بتوانیم دادهها را طوری فرمول بندی کنیم که بتوان از آن برای اعمال الگوریتم یادگیری ماشینی بر روی آن استفاده کرد.
این فصل از کتاب Mastering Classification Algorithms for Machine Learning شامل بحثی است در مورد اینکه چگونه مجموعه دادههای نامتعادل را میتوان متعادل کرد. همچنین، این فصل در مورد چگونگی استفاده از تجزیه و تحلیل مؤلفه اصلی برای کاهش ابعاد داده بحث میکند.
فصل 6: مدلهای گروهی – در مورد اینکه چند مدل ضعیف میتوانند برای تشکیل یک مدل قوی ترکیب شوند، بحث میکند. این فصل همچنین نحوه فرمول بندی مدلهای گروهی، از جمله مدلهای Voting، Bagging، Boosting و Stacking را مورد بحث قرار میدهد.
این فصل از کتاب Mastering Classification Algorithms for Machine Learning با بحث در مورد چگونگی تشخیص احساسات از گفتار به پایان میرسد. برای اینکه بتوانیم این کار را انجام دهیم، این فصل نحوه استخراج و فرموله کردن اطلاعات از کلیپهای صوتی را برای استفاده در یک مدل یادگیری ماشین بحث میکند.
فصل 7: الگوریتم جنگل تصادفی یک الگوریتم قدرتمند و پیشرفته در یادگیری ماشین است. یک مورد خاص از مدل Bagging Ensemble میباشد. این فصل فرمولبندی الگوریتم جنگل تصادفی را مورد بحث قرار میدهد و اینکه چه چیزی مدل را از تعصب و واریانسی که به خوبی روی دادههای واقعی کار میکند، آزاد میکند. کاربرد شناسایی بدافزار در فایل های ELF با استفاده از الگوریتم Random Forest مورد بحث قرار گرفته است.
فصل 8: الگوریتم تقویت یکی دیگر از الگوریتمهای پیشرفته برای حل مسائل طبقه بندی است. این فصل از کتاب Mastering Classification Algorithms for Machine Learning با استفاده از یک مثال الگوریتم AdaBoost را طی میکند. الگوریتم AdaBoost در درجه اول از الگوریتم درخت تصمیم به عنوان هسته استفاده میکند.
بنابراین، الگوریتم درخت تصمیم دوباره در این فصل مورد بررسی قرار میگیرد. این فصل از کتاب Mastering Classification Algorithms for Machine Learning مشکل طبقه بندی تصاویر را با استفاده از الگوریتم AdaBoost حل میکند. از آنجایی که حتی الگوریتم قدرتمندی مانند AdaBoost نتایج رضایت بخشی را برای طبقه بندی ویدئو ایجاد نمیکند، فصل با معرفی شبکههای عصبی به پایان میرسد.
علاوه بر هشت فصل، کتاب دارای 8 ضمیمه برای تکمیل مباحث با مفاهیم لازم است.
پیوست 1: نوت بوک Jupyter یک محیط توسعه یکپارچه (IDE) است که برای توسعه و اجرای تمام کدهای مورد بحث در این کتاب استفاده می شود. فایلهای حاوی تمامی کدهای مطرح شده در این کتاب به عنوان مطالب تکمیلی همراه با کتاب ارائه شده است. تمامی این کدها به صورت نوت بوک Jupyter هستند. این ضمیمه اصول اولیه نوت بوک Jupyter را مورد بحث قرار میدهد.
پیوست 2: پایتون زبان برنامهنویسی مورد استفاده در این کتاب است. این ضمیمه اصول برنامهنویسی پایتون را معرفی میکند.
پیوست 3: تجزیه ارزش منفرد یکی از روشهای کاهش ابعاد دادهها است. این ضمیمه ریاضیات پشت تجزیه ارزش واحد (SVD) را مورد بحث قرار میدهد و کاربرد SVD را برای فشرده سازی تصویر نشان میدهد.
پیوست 4: پیش پردازش دادههای متنی یکی از مراحل ضروری قبل از اعمال دادههای متنی برای یادگیری ماشین است. این پیوست مراحل پیش پردازش ضروری برای پاکسازی دادههای متنی را مورد بحث قرار میدهد.
پیوست 5: Stemming و Lamentation مکانیسمهایی هستند که در پیش پردازش دادههای متنی به کار میروند. این پیوست هر دو این تکنیکها را با مثالهایی مورد بحث قرار میدهد.
ضمیمه 6: بردارها برای تبدیل دادههای متنی به اعداد برای استفاده در مدلهای یادگیری ماشین استفاده میشوند. مدلهای یادگیری ماشینی را میتوان تنها با استفاده از دادههای عددی ساخت و بنابراین، وجود مکانیزمی برای تبدیل دادههای متنی به اعداد ضروری است. این پیوست دو بردار را مورد بحث قرار میدهد – Count Vectorizer و TF-IDF Vectorizer.
پیوست 7: رمزگذارها برای تبدیل دادههای متنی به اعداد استفاده میشوند تا در مدلهای یادگیری ماشین اعمال شوند. مدلهای یادگیری ماشینی را میتوان تنها با استفاده از دادههای عددی ساخت و بنابراین، وجود مکانیزمی برای تبدیل دادههای متنی به اعداد ضروری است. این ضمیمه رمزگذارهای مختلف را مورد بحث قرار میدهد.
پیوست 8: از آنتروپی در تشکیل درخت تصمیم استفاده میشود. در فصل 5 کتاب Mastering Classification Algorithms for Machine Learning چگونگی شکل گیری درختان تصمیم با استفاده از شاخص جینی بحث شد. این پیوست یک روش جایگزین برای تشکیل درخت تصمیم با استفاده از آنتروپی و به دست آوردن اطلاعات ارائه میدهد.
سرفصلهای کتاب Mastering Classification Algorithms for Machine Learning:
- Mastering Classification Algorithms for Machine Learning
- About the Author
- Acknowledgement
- Preface
- Table of Contents
- 1. Introduction to Machine Learning
- 2. Naïve Bayes Algorithm
- 3. K-Nearest Neighbor Algorithm
- 4. Logistic Regression
- 5. Decision Tree Algorithm
- 6. Ensemble Models
- 7. Random Forest Algorithm
- 8. Boosting Algorithm
- Annexure 1: Jupyter Notebook
- Annexure 2: Python
- Annexure 3: Singular Value Decomposition
- Annexure 4: Preprocessing Textual Data
- Annexure 5: Stemming and Lamentation
- Annexure 6: Vectorizers
- Annexure 7: Encoders
- Annexure 8: Entropy
- Index
جهت دانلود کتاب Mastering Classification Algorithms for Machine Learning میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.