کتاب Modern Deep Learning for Tabular Data (یادگیری عمیق مدرن برای دادههای جدولی: رویکردهای جدید به مسائل رایج مدلسازی) از جدیدترین منابع در زمینه یادگیری عمیق و یادگیری ماشین است. این کتاب در 3 بخش مختلف به شرح یادگیری عمیق و کاربرد آن در دادههای جدولی خواهد پرداخت.
در ادامه مقدمهای از کتاب Modern Deep Learning for Tabular Data را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Modern Deep Learning for Tabular Data:
این کتاب در 12 فصل در سه بخش تنظیم شده است.
بخش 1، “یادگیری ماشین و دادههای جدولی”، شامل فصل 1، “اصول و روشهای یادگیری ماشین کلاسیک” و فصل 2، “آماده سازی و مهندسی دادهها” است. این بخش مفاهیم یادگیری ماشین و داده مرتبط با موفقیت را در ادامه کتاب معرفی میکند.
فصل 1 کتاب Modern Deep Learning for Tabular Data، «اصول و روشهای یادگیری ماشین کلاسیک»، مفاهیم و الگوریتمهای مهم یادگیری ماشین را پوشش میدهد. این فصل تئوری و اجرای چندین مدل پایه یادگیری ماشین و رقبای یادگیری عمیق جدولی، از جمله مدلهای تقویت گرادیان را نشان میدهد. همچنین پل بین یادگیری کلاسیک و عمیق را مورد بحث قرار میدهد.
فصل 2، «آمادهسازی و مهندسی دادهها»، توضیح گستردهای از روشهای دستکاری، مدیریت، تبدیل و ذخیره دادههای جدولی است (و همچنین سایر اشکال دادهای که ممکن است برای یادگیری چندوجهی نیاز داشته باشید). این فصل مجموعه دادههای NumPy، Pandas و TensorFlow (بومی و سفارشی) را مورد بحث قرار میدهد. روشهای رمزگذاری برای دادههای مقوله ای، متنی، زمانی و جغرافیایی؛ عادی سازی و استانداردسازی (و انواع)؛ تغییرات ویژگی، از جمله از طریق کاهش ابعاد. و انتخاب ویژگی
بخش 2، “معماریهای یادگیری عمیق کاربردی”، شامل فصل 3، “شبکههای عصبی و دادههای جدولی” است.
فصل 4 کتاب Modern Deep Learning for Tabular Data، “کاربرد ساختارهای کانولوشن در دادههای جدولی”. فصل 5، “استفاده از ساختارهای تکراری در دادههای جدولی”. فصل 6، «توجه به دادههای جدولی»؛ و فصل 7، “رویکردهای یادگیری عمیق مبتنی بر درخت”.
این بخش اکثریت کتاب را تشکیل میدهد و نشان میدهد که چگونه معماریهای شبکههای عصبی مختلف در “کاربرد اصلی” خود عمل میکنند و چگونه میتوان آنها را برای دادههای جدولی به دو روش بصری و غیر شهودی تخصیص داد. فصلهای 3، 4، و 5 هر کدام یکی از سه حوزه تثبیتشده (حتی «سنتی») یادگیری عمیق – شبکههای عصبی مصنوعی (ANN)، شبکههای عصبی کانولوشنال، و شبکههای عصبی تکراری – و ارتباط آنها با دادههای جدولی را متمرکز میکنند.
فصلهای 6 و 7 کتاب Modern Deep Learning for Tabular Data در مجموع دو مورد از برجستهترین جهتهای تحقیقاتی مدرن در کاربرد یادگیری عمیق در دادههای جدولی را پوشش میدهند – روشهای توجه/تبدیلکننده، که از شباهت مدلسازی روابط متقاطع/نشانه و مدلسازی روابط متقابل ویژگیها و درخت الهام میگیرند. روشهای شبکههای عصبی مبتنی بر، که تلاش میکنند به نوعی ساختار یا قابلیتهای مدلهای مبتنی بر درخت را در قالب شبکه عصبی تقلید کنند.
فصل 3 کتاب Modern Deep Learning for Tabular Data، “شبکههای عصبی و دادههای جدولی”، مبانی تئوری شبکههای عصبی – پرسپترون چند لایه، اشتقاق پس انتشار، توابع فعال سازی، توابع از دست دادن، و بهینهسازها – و TensorFlow/Keras API برای پیادهسازی شبکههای عصبی را پوشش میدهد.
روشهای شبکه عصبی نسبتاً پیشرفته مانند فراخوانی، نرمالسازی دستهای، حذف، معماریهای غیرخطی و مدلهای چند ورودی/چند خروجی نیز مورد بحث قرار میگیرند. هدف این فصل ارائه یک پایه نظری مهم برای درک شبکههای عصبی و ابزارهایی برای شروع پیادهسازی شبکههای عصبی کاربردی برای مدلسازی دادههای جدولی است.
فصل 4 کتاب Modern Deep Learning for Tabular Data، “کاربرد ساختارهای کانولوشن در دادههای جدولی” با نشان دادن مکانیک سطح پایین عملیات کانولوشن و ادغام آغاز میشود و به دنبال آن ساخت و استفاده از شبکههای عصبی کانولوشن استاندارد برای دادههای تصویری.
کاربرد ساختارهای کانولوشن برای دادههای جدولی به سه روش بررسی میشود: مجموعه دادههای تصویری و جدولی چندوجهی، پیچیدگیهای یک بعدی و پیچیدگیهای دو بعدی. این فصل به ویژه به کاربردهای بیولوژیکی مرتبط است، که اغلب از روشهایی در این فصل استفاده میکنند.
بیشتر بخوانید: کتاب Advanced Data Analytics Using Python
فصل 5، «اعمال ساختارهای مکرر برای دادههای جدولی»، مانند فصل 4، با نشان دادن سه نوع مدلهای تکراری آغاز میشود – لایه بازگشتی «وانیلی»، لایه حافظه کوتاهمدت بلندمدت (LSTM) و لایه واحد بازگشتی دردار. – ویژگیهای متوالی را در ورودی ثبت کنید.
مدلهای تکراری برای متن، سریهای زمانی و دادههای چندوجهی اعمال میشوند. در نهایت، روشهای نظری برای اعمال مستقیم لایههای تکراری به دادههای جدولی پیشنهاد شدهاند. فصل 6، “استفاده از توجه به دادههای جدولی”، مکانیسم توجه و خانواده مدلهای ترانسفورماتور را معرفی میکند. مکانیسم توجه به متن، دادههای متنی و جدولی چندوجهی و زمینههای جدولی اعمال میشود. چهار مقاله تحقیقاتی – TabTransformer، TabNet، SAINT (Self-Attention and Intersample Attention Transformer)، و ARM-Net – به تفصیل مورد بحث قرار گرفته و اجرا شده است.
فصل 7 کتاب Modern Deep Learning for Tabular Data، «رویکردهای یادگیری عمیق مبتنی بر درخت»، عمدتاً بر پژوهش متمرکز است و بر سه کلاس اصلی شبکههای عصبی مبتنی بر درخت تمرکز دارد: شبکههای عصبی الهامگرفته از درخت/شبکههای عصبی، که تلاش میکنند شخصیت مدلهای درختی را در معماری یا ساختار تکرار کنند. یک شبکه عصبی؛ انباشته کردن و تقویت شبکههای عصبی؛ و تقطیر، که دانش درختی را به یک شبکه عصبی منتقل میکند.
بخش 3، «طراحی و ابزارهای یادگیری عمیق»، شامل فصل 8، «رمزگذارهای خودکار» است. فصل 9، «تولید داده»؛ فصل 10، “فرا بهینه سازی”؛ فصل 11، “آرایش چند مدل”؛ و فصل 12 کتاب Modern Deep Learning for Tabular Data، «تفسیرپذیری شبکه عصبی». این بخش نشان میدهد که چگونه شبکههای عصبی را میتوان فراتر از وظیفه خام مدلسازی نظارت شده در فصلهای کوتاهتر استفاده و درک کرد.
فصل 8، رمزگذارهای خودکار، ویژگیهای معماری رمزگذار خودکار را معرفی میکند و نشان میدهد که چگونه میتوان از آنها برای پیشآموزش، یادگیری چندکاره، یادگیری پراکنده/قوی، و حذف نویز استفاده کرد.
فصل 9 کتاب Modern Deep Learning for Tabular Data، «تولید داده»، نشان میدهد که چگونه رمزگذارهای خودکار متغیر و شبکههای متخاصم مولد میتوانند برای تولید دادههای جدولی در زمینههای داده محدود اعمال شوند.
فصل 10، “متا بهینه سازی” نشان میدهد که چگونه بهینه سازی بیزی با Hyperopt میتواند برای خودکارسازی بهینه سازی متا پارامترها از جمله خط لوله کدگذاری دادهها و معماری مدل، و همچنین اصول اولیه جستجوی معماری عصبی به کار گرفته شود.
فصل 11 کتاب Modern Deep Learning for Tabular Data، «آرایش چند مدلی»، نشان میدهد که چگونه مدلهای شبکه عصبی میتوانند به صورت پویا ترکیب شوند و با هم چیده شوند تا عملکرد را افزایش دهند یا کیفیت پیشبینی مدل زنده/زمان واقعی را ارزیابی کنند.
فصل 12، «تفسیرپذیری شبکه عصبی»، سه روش، هر دو مدل-آگنوستیک و مدل خاص، برای تفسیر پیشبینیهای شبکههای عصبی ارائه میکند.
تمام کدهای کتاب در یک مخزن در Apress’s GitHub در اینجا موجود است: https://github.com/ apress/modern-deep-learning-tabular-data. ما خوشحالیم که در مورد کتاب و سایر موضوعات با شما صحبت میکنیم. میتوانید در [email protected] به آندره و در [email protected] به اندی برسید. امیدواریم این کتاب قابل تامل و جالب باشد و – از همه مهمتر – شما را به تفکر انتقادی در مورد رابطه بین یادگیری عمیق و دادههای جدولی ترغیب کند. خواندن مبارک، و از اینکه در این ماجراجویی به ما پیوستید متشکریم!
سرفصلهای کتاب Modern Deep Learning for Tabular Data:
- Table of Contents
- About the Authors
- About the Technical Reviewer
- Acknowledgments
- Foreword
- Foreword
- Introduction
- Part I: Machine Learning and Tabular Data
- Chapter 1: Classical Machine Learning Principles and Methods
- Chapter 2: Data Preparation and Engineering
- Part II: Applied Deep Learning Architectures
- Chapter 3: Neural Networks and Tabular Data
- Chapter 4: Applying Convolutional Structures to Tabular Data
- Chapter 5: Applying Recurrent Structures to Tabular Data
- Chapter 6: Applying Attention to Tabular Data
- Chapter 7: Tree-Based Deep Learning Approaches
- Part III: Deep Learning Design and Tools
- Chapter 8: Autoencoders
- Chapter 9: Data Generation
- Chapter 10: Meta-optimization
- Chapter 11: Multi-model Arrangement
- Chapter 12: Neural Network Interpretability
- Appendix: NumPy and Pandas
- Index
جهت دانلود کتاب Modern Deep Learning for Tabular Data میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.