کتاب Introduction to Machine Learning یا مقدمهای بر یادگیری ماشین چهارمین نسخه از ویرایش خود را در سال 2020 منتشر کرد که توجه بسیاری از محققان در این زمینه را به خود معطوف کرد. این کتاب فوقالعاده در 20 فصل به شرح مسائل مربوط به یادگیری ماشین به همراه تئوریهای ریاضی مربوط به آنها میپردازد. مطالعهی این کتاب درک عمیقی را به خواننده جهت یادگیری این علم خواهد بخشید.
در ادامه به شرح مقدمهای از کتاب Introduction to Machine Learning را از زبان نویسنده کتاب خواهیم پرداخت.
مقدمهای بر کتاب Introduction to Machine Learning:
یادگیری ماشین زیر بنای جالبترین فناوریهای امروزی است. از تشخیص چهره گرفته تا اتومبیلهای خودران، از تشخیص گفتار گرفته تا ترجمه، برنامههایی که به طور فزایندهای به بخشی از زندگی روزمره ما تبدیل شدهاند، همه دارای مؤلفههای یادگیری هستند. در واقع اگر چنین یادگیری ماشینی نبود، اکثر چنین سیستمهایی امروزه امکانپذیر نبود. با افزایش دسترسپذیری دادهها و قدرت محاسباتی برای پردازش آن، ما بیشتر و بیشتر تمایل داریم که به سیستم اجازه دهیم به جای برنامهریزی صریح برای کار، از دادههای جمعآوری شده یا آزمایش و خطا به تنهایی یاد بگیرد.
یک خودروی خودران با دادههایی آموزش داده میشود که دارای سناریوهای ترافیکی بسیار بیشتر یا شرایط آب و هوایی متنوعتر از آن چیزی است که حتی باتجربهترین راننده انسانی میتواند زندگی کند. AlphaGo، برنامهای که بازی Go را یاد میگیرد، بیشتر از هر بازی دیگری که بتواند در طول زندگی انجام دهد بازی کرده و از آن یاد گرفته است، و چون مدام با خودش بازی میکرد و در حال یادگیری بود، انگار با بهتر و بهتر رقابت میکرد. بازیکنان بهتر یک برنامه آموزشی که برای ترجمه، مثلاً از انگلیسی به فرانسوی، آموزش دیده است، بیشتر از هر مترجم انسانی متون نمونه را مشاهده میکند.
یادگیری ماشین یکی از جذابترین زمینههای تحقیقاتی در علوم کامپیوتر است. همانطور که فناوری دیجیتال به طور فزایندهای در زندگی ما نفوذ میکند، دادههای بیشتری به طور مداوم تولید و جمعآوری میشود. سیستمهای کامپیوتری ما نیز سریعتر میشوند و اکنون میتوانند دادههای بزرگتر را پردازش کنند. نظریه زیربنای الگوریتمهای یادگیری نیز به سرعت در حال پیشرفت است. این تکامل موازی نظریه، محاسبات و دادهها از زمان چاپ سوم در سال 2014 حتی قوی تر شده است.
در این دهه اخیر، کاربرد یادگیری عمیق به عنوان رویکرد غالب در یادگیری ماشین افزایش یافته است. شبکههای عصبی مصنوعی که در اواخر دهه 1980 و اوایل 1990 محبوب بودند، در برخی حوزهها موفق بودند. شبکه TES-Gammon Tesauro که بازی تخته نرد را یاد میگیرد و شبکه تشخیص رقم دستنویس LeCun بلافاصله به ذهن میآید. اما در آن زمان پیدا کردن مجموعه دادههای بزرگ دشوار بود و قدرت محاسبات محدود بود.
در سالهای اخیر، با استفاده از دادههای بیشتر و پردازندههای ارزانتر و سریعتر، امکان ایجاد و آموزش شبکههای “عمیق” با لایهها و واحدهای متعدد فراهم شده است، و به طور شگفتانگیزی در بسیاری از حوزه ها موفق بودند. نیروی محرک دیگر در دسترس بودن بسترهای نرمافزاری باز است که برنامهنویسی چنین شبکههای عمیقی را بسیار آسان میکند. شبکههایی که عمیقتر از LeNet LeCun هستند در حال حاضر در برنامههای دید پیچیدهتری مانند تشخیص چهره، ایجاد زیرنویس برای تصاویر و اتومبیلهای خودران استفاده میشوند. شبکهای که عمیقتر از Tesauro’s TD-Gammon است، Go را آموخته است، بازی که مدتها تصور میشد فراتر از تواناییهای هوش مصنوعی است.
یکی از جالبترین جنبههای یادگیری عمیق این است که یادگیری پایان به پایان است. ما فقط ورودی را در ابتدا و خروجی مورد نظر را در انتها ارائه میدهیم و هرگونه تغییر و تحول مورد نیاز در این بین بطور خودکار توسط بسیاری از لایههای میانی و “پنهان” شبکه آموخته میشود.
چنین شبکههایی معمولاً دارای ساختار دو مرحلهای هستند، جایی که مرحله اول-“رمزگذار”-ورودی را میگیرد و در لایههای اولیه شبکه آن را به صورت “کد” میانی فشرده میکند.
مرحله دوم – “رمزگشایی” – این را به عنوان ورودی در نظر گرفته و در لایههای نهایی شبکه خروجی را ترکیب میکند. یادگیری تمام و کمال به این معنی است که این دو با هم آموزش میبینند و قالب کد میانی بین آنها نیز به طور خودکار تعیین میشود.
ما با چنین ساختارهایی در علوم کامپیوتر آشنا هستیم. به عنوان مثال، یک کامپایلر دارای یک قسمت جلویی است که در کد منبع میخواند، آن را از نظر لغوی و نحوی تجزیه و تحلیل میکند و یک نمایش متوسط ایجاد میکند. قسمت انتهایی این نمایش میانی را میگیرد و کد شی را تولید میکند. یک شبکه عمیق مشابه است، با این تفاوت که هر دو انتهای آن هستند آموخته و با هم آموخته میشوند.
یک ماشین خودران را در نظر بگیرید. بگذارید بگوییم که دارای دوربینی است که مسیر جلو را میبیند و خروجی آن زاویه فرمان است. به طور معمول چنین سیستمی از دو ماژول پشت سر هم تشکیل شده است. یک ماژول ادراکی وجود دارد که دادههای حسی را از دوربین میگیرد، آن را پردازش میکند و یک نمایش انتزاعی را ایجاد میکند که صحنه را از نظر ویژگیهای ضروری برای فرمان خلاصه میکند، و یک ماژول عملیاتی وجود دارد که خروجی فرمان را بر اساس در آن. این دو ماژول توسط دو تیم متشکل از مهندسان با مهارتهای مختلف که تقریباً مستقل کار میکنند اجرا میشود، مگر در تعریف نمایندگی متوسط که رابط دو ماژول است.
یک شبکه عمیق آموزش داده شده تا انتها شامل هر دو ماژول است و آنها را با هم آموزش میدهد. یک شبکه عمیق دارای لایههای اولیه “متحرک” است که تصویر را پردازش میکند و نمایشهای انتزاعی پیدرپی از صحنه ایجاد میکند، و به طور خلاصه، آن لایههای اولیه با ماژول ادراک مطابقت دارد. پس از آن، به اصطلاح لایههای کاملاً متصل وجود دارد، که وظیفهی آنها ترکیب خروجی است، که در این مورد مربوط به انتخاب عملکرد مناسب است.
هرگونه نمایش میانی بین این دو مورد ضروری است، یا هر ویژگی دیگری که باید توسط ماژول ادراک تشخیص داده شود، همه از دادهها آموخته میشود تا دقت در خروجی، در انتهای شبکه حداکثر شود. شبکههای عمیقی که در بسیاری از برنامهها مورد استفاده قرار میگیرند دارای این ساختار ادراک-عمل، تجزیهکننده-ترکیبکننده یا رمزگذار-رمزگشا هستند.
مطابق با پیشرفتهای اخیر، تغییرات نسخه جدید بیشتر مربوط به شبکههای عصبی و یادگیری عمیق است.
فصل 11 کتاب Introduction to Machine Learning، درباره پرسپرترونهای چند لایه دارای دو بخش جدید است: رمزگشای خودکار، که در شبکههای عصبی عمیق محبوب شده است، به تفصیل در یک مورد بررسی شده است. دیگری در مورد شبکه word2vec بحث میکند که هم در شیوه جدید تعریف وظیفه جالب است و هم به دلیل اینکه به روشی متداول برای نمایش کلمات در وظایف پردازش زبان طبیعی تبدیل شده است.
فصل جدیدی در زمینه یادگیری عمیق به کتاب Introduction to Machine Learning، اضافه شده است. این مقاله بحث پرسپترونهای چند لایه را گسترش میدهد و شامل بخشهایی در مورد آموزش شبکههای عصبی عمیق است، آنها را منظم میکند تا بهتر یاد بگیرند، آنها را برای بهبود یادگیری، به عنوان مثال، از طریق لایههای متحرک و توسعههای مکرر آنها با حافظه کوتاه مدت لازم برای یادگیری دنبالهها، تنظیم میکند. همچنین بخشی در مورد شبکههای متخاصم تولید کننده وجود دارد که در سالهای اخیر کاربردهای چشمگیری را یافتهاند.
فصل 19 کتاب Introduction to Machine Learning، درباره یادگیری تقویتی دارای بخشهای جدیدی است که درباره استفاده از شبکههای عمیق در یادگیری تقویتی بحث میکند. یک بخش جدید در مورد روش گرادیان خط مشی وجود دارد که در سالهای اخیر اغلب در شبکههای عصبی مورد استفاده قرار گرفته است، و دو بخش اضافی در مورد دو مثال از یادگیری تقویت عمیق، که هر دو به ترتیب در سال 2015 و 2016 تیتر شدند. یکی شبکهای است که بازیهای ویدیویی آرکید را میآموزد و دیگری بازی Go را یاد میگیرد.
علاوه بر این، یک بخش جدید به فصل 6 کتاب Introduction to Machine Learning در مورد t-SNE اضافه شده است، یک روش کاهش ابعاد که در سالهای اخیر اغلب به ویژه برای تجسم استفاده می شود. همچنین بخشهای جدیدی در زمینه طبقهبندی چند برچسب در فصل 10 کتاب Introduction to Machine Learning برای پرسپترونهای خطی و در فصل 11 کتاب Introduction to Machine Learning، برای پرسپترونهای چند لایه وجود دارد. ما امروزه از آنها استفاده میکنیم، به عنوان مثال، در برچسب زدن تصاویر. ضمائم B و C، در مورد جبر خطی و بهینهسازی، نیز در کتاب Introduction to Machine Learning از موارد جدید هستند، که برای یادآوری مفاهیم اولیهای که در یادگیری ماشین کاربرد دارد، به خواننده اضافه میشود.
من میخواهم از همه-اساتیدی که از کتاب Introduction to Machine Learning برای تدریس استفاده میکنند، دانشآموزانشان و کسانی که از آن برای خودآموزی استفاده میکنند تشکر کنم-که از زمان چاپ اول در سال 2004، سؤالات و پیشنهاداتی را برای من ارسال کرده و خطاها را به من اطلاع میدهند، و به من در بهبود محتوا کمک کرده است. یک کتاب، به ویژه یک کتاب درسی، به همان اندازه توسط خوانندگانش نوشته شده است که نویسنده آن. آدرس ایمیل من [email protected] است و پشتیبانی آنلاین مربیان از طریق صفحه وب ناشر برای کتاب در mitpress.mit.edu/books/introduction-machine-learning-fourth-edition قابل دسترسی است.
تقریباً بیست سال از شروع همکاری من با MIT Press میگذرد و همکاری با کارکنان عالی آن همیشه یک تجربه منحصر به فرد بوده است. همکاری مجدد با آنها در چاپ چهارم کتاب Introduction to Machine Learning بسیار لذتبخش بود و من میخواهم از Kate Gibson و Marcy Ross بخاطر مطالعه دقیق نسخه خطی و به ویژه Marie Lufkin Lee، به خاطر همه کمکها و حمایتهایشان تشکر کنم.
در صورت علاقه به یادگیری ماشین میتوانید از کتاب Introducing Machine Learning نیز بهرهمند شوید.
سرفصلهای کتاب Introduction to Machine Learning:
- 1 Introduction
- 2 Supervised Learning
- 3 Bayesian Decision Theory
- 4 Parametric Methods
- 5 Multivariate Methods
- 6 Dimensionality Reduction
- 7 Clustering
- 8 Nonparametric Methods
- 9 Decision Trees
- 10 Linear Discrimination
- 11 Multilayer Perceptrons
- 12 Deep Learning
- 13 Local Models
- 14 Kernel Machines
- 15 Graphical Models
- 16 Hidden Markov Models
- 17 Bayesian Estimation
- 18 Combining Multiple Learners
- 19 Reinforcement Learning
- 20 Design and Analysis of Machine Learning Experiments
- A Probability
- B Linear Algebra
- C Optimization
فایل کتاب Introduction to Machine Learning را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.