کتاب Generative Deep Learning (یادگیری عمیق مولد: آموزش ماشینها برای نقاشی، نوشتن و بازی، ویرایش دوم) یک منبع کاربردی برای یادگیری Deep Learning و یکی از کاربردهای آن یعنی مدلسازی مولد است که به تازگی به چاپ رسیده است.
در ادامه مقدمهای از کتاب Generative Deep Learning را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Generative Deep Learning:
آنچه را که نمیتوانم خلق کنم، نمیفهمم.
ریچارد فاینمن
هوش مصنوعی مولد یکی از انقلابیترین فناوریهای زمان ما است که نحوه تعامل ما با ماشینها را متحول کرده است. پتانسیل آن برای متحول کردن شیوه زندگی، کار و بازی ما موضوع گفتگوها، بحثها و پیشبینیهای بیشماری بوده است. اما اگر پتانسیل بیشتری برای این فناوری قدرتمند وجود داشت، چه؟ اگر امکانات هوش مصنوعی مولد فراتر از تصورات فعلی ما باشد، چه؟ آینده هوش مصنوعی مولد ممکن است هیجانانگیزتر از آن چیزی باشد که تا به حال فکر میکردیم…
از همان روزهای اولیه، ما به دنبال فرصتهایی برای ایجاد خلاقیتهای بدیع و زیبا بودهایم. برای انسانهای اولیه، این به شکل نقاشیهای غارهایی بود که حیوانات وحشی و الگوهای انتزاعی را به تصویر میکشیدند که با رنگدانههایی که بهدقت و روشمند بر روی سنگ قرار میگرفتند، خلق شده بودند.
دوران رمانتیک به ما تسلط بر سمفونیهای چایکوفسکی را داد، با توانایی آنها در القای احساسات پیروزی و تراژدی از طریق امواج صوتی، با هم تنیده شده تا ملودیها و هارمونیهای زیبا را تشکیل دهند. و در زمانهای اخیر متوجه شدهایم که نیمهشب برای خرید داستانهایی درباره یک جادوگر تخیلی به کتابفروشیها عجله میکنیم، زیرا ترکیب حروف روایتی را ایجاد میکند که ما را وادار میکند ورق را ورق بزنیم و بفهمیم چه بر سر قهرمانمان میآید.
بنابراین تعجب آور نیست که بشریت شروع به طرح سؤال نهایی خلاقیت کرده است: آیا میتوانیم چیزی خلق کنیم که به خودی خود خلاق باشد؟
این سوالی است که هوش مصنوعی مولد قصد دارد به آن پاسخ دهد. با پیشرفتهای اخیر در روششناسی و فناوری، ما اکنون میتوانیم ماشینهایی بسازیم که میتوانند آثار هنری اصلی را به سبک معین نقاشی کنند، بلوکهای منسجمی از متن را با ساختار طولانیمدت بنویسند، موسیقی بسازند که گوش دادن به آن لذت بخش باشد، و استراتژیهای برنده را توسعه دهند.
بازیهای پیچیده با ایجاد سناریوهای خیالی آینده. این تازه شروع یک انقلاب مولد است که برای ما چارهای باقی نمیگذارد جز یافتن پاسخهایی برای برخی از بزرگترین سؤالات در مورد مکانیک خلاقیت، و در نهایت، معنای انسان بودن.
به طور خلاصه، هرگز زمان بهتری برای یادگیری در مورد هوش مصنوعی مولد وجود نداشته است – پس بیایید شروع کنیم!
هدف و رویکرد
کتاب Generative Deep Learning هیچ دانش قبلی از هوش مصنوعی مولد را فرض نمیکند. ما همه مفاهیم کلیدی را از ابتدا به روشی بصری و آسان برای دنبال کردن ایجاد خواهیم کرد، بنابراین اگر تجربه ای با هوش مصنوعی مولد ندارید نگران نباشید. شما به جای مناسب آمده اید!
این کتاب بهجای پوشش دادن تکنیکهایی که در حال حاضر مرسوم هستند، بهعنوان راهنمای کاملی برای مدلسازی مولد است که طیف وسیعی از خانوادههای مدل را پوشش میدهد. هیچ تکنیکی وجود ندارد که از نظر عینی بهتر یا بدتر از هر تکنیک دیگری باشد – در واقع، بسیاری از مدلهای پیشرفته اکنون ایدههایی را از طیف وسیعی از رویکردهای مدلسازی مولد با هم ترکیب میکنند.
به همین دلیل، مهم است که به جای تمرکز بر روی یک نوع تکنیک خاص، از پیشرفتها در همه حوزههای هوش مصنوعی مولد مطلع باشیم. یک چیز مسلم است: حوزه هوش مصنوعی مولد به سرعت در حال حرکت است، و شما هرگز نمیدانید ایده پیشگامانه بعدی از کجا خواهد آمد!
با در نظر گرفتن این موضوع، رویکردی که من در پیش خواهم گرفت این است که به شما نشان دهم چگونه مدلهای تولیدی خود را بر اساس دادههای خود آموزش دهید، نه اینکه بر روی مدلهای از پیش آموزشدیدهشده استفاده کنید.
در حالی که در حال حاضر بسیاری از مدلهای مولد منبع باز چشمگیر وجود دارد که میتوان آنها را دانلود کرد و در چند خط کد اجرا کرد، هدف کتاب Generative Deep Learning این است که از اصول اولیه معماری و طراحی آنها را عمیق تر کند تا درک کاملی از چگونگی به دست آورید. آنها کار میکنند و میتوانند نمونههایی از هر تکنیک را از ابتدا با استفاده از Python و Keras کدنویسی کنند.
به طور خلاصه، کتاب Generative Deep Learning را میتوان به عنوان نقشه ای از چشم انداز هوش مصنوعی مولد فعلی در نظر گرفت که هم کاربردهای تئوری و هم کاربردی را پوشش میدهد، از جمله نمونههای کاری کامل از مدلهای کلیدی از ادبیات. ما کدهای مربوط به هر تکنیک را گام به گام، با نشانههای واضحی که نشان میدهد چگونه تئوری هر تکنیک را پیاده سازی میکند، مرور خواهیم کرد. این کتاب را میتوان از روی جلد خواند یا بهعنوان کتاب مرجعی که میتوانید در آن غوطهور کنید، استفاده کنید. مهمتر از همه، امیدوارم که خواندن آن برای شما مفید و لذت بخش باشد!
بیشتر بخوانید: کتاب Modern Deep Learning for Tabular Data
نقشه راه
کتاب Generative Deep Learning به سه بخش تقسیم شده است.
بخش اول یک مقدمه کلی برای مدلسازی مولد و یادگیری عمیق است، که در آن مفاهیم اصلی را که زیربنای تمام تکنیکهای بخشهای بعدی کتاب هستند، بررسی میکنیم:
در فصل 1، “مدل سازی مولد”، مدل سازی مولد را تعریف میکنیم و یک مثال اسباب بازی را در نظر میگیریم که میتوانیم از آن برای درک برخی از مفاهیم کلیدی که برای همه مدلهای مولد مهم هستند، استفاده کنیم. ما همچنین طبقهبندی خانوادههای مدل مولد را که در قسمت دوم کتاب Generative Deep Learning بررسی خواهیم کرد، ارائه میکنیم.
در فصل 2، “یادگیری عمیق”، کاوش خود را در زمینه یادگیری عمیق و شبکههای عصبی با ساختن اولین نمونه از پرسپترون چند لایه (MLP) با استفاده از Keras آغاز میکنیم. سپس این را با لایههای کانولوشنال و سایر پیشرفتها وفق میدهیم تا تفاوت عملکرد را مشاهده کنیم.
بخش دوم کتاب Generative Deep Learning شش تکنیک کلیدی را که برای ساختن مدلهای مولد از آنها استفاده خواهیم کرد، با مثالهای عملی برای هر کدام شرح میدهد:
در فصل 3، “Variational Autoencoder”، ما رمزگذار خودکار متغیر (VAE) را در نظر میگیریم و میبینیم که چگونه میتوان از آن برای تولید تصاویر چهرهها و تغییر شکل بین چهرهها در فضای پنهان مدل استفاده کرد.
در فصل 4، «شبکههای متخاصم مولد»، شبکههای متخاصم مولد (GAN) را برای تولید تصویر، از جمله GANهای پیچیده پیچیده، GANهای شرطی، و پیشرفتهایی مانند Wasserstein GAN که فرآیند آموزش را پایدارتر میکند، بررسی میکنیم.
در فصل 5 کتاب Generative Deep Learning، «مدلهای خودرگرسیون»، توجه خود را به مدلهای خودرگرسیون معطوف میکنیم، و با مقدمهای بر شبکههای عصبی تکرارشونده مانند شبکههای حافظه کوتاهمدت (LSTMs) برای تولید متن و PixelCNN برای تولید تصویر شروع میکنیم.
در فصل 6، «نرمالسازی مدلهای جریان»، ما بر عادیسازی جریانها تمرکز میکنیم، از جمله یک کاوش نظری بصری از تکنیک و یک مثال عملی از نحوه ساخت یک مدل RealNVP برای تولید تصاویر.
در فصل 7 کتاب Generative Deep Learning، “مدلهای مبتنی بر انرژی”، مدلهای مبتنی بر انرژی، از جمله روشهای مهمی مانند نحوه آموزش با استفاده از واگرایی متضاد و نمونه با استفاده از دینامیک لانژوین را پوشش میدهیم.
در فصل 8، “مدلهای انتشار”، ما به یک راهنمای عملی برای ساخت مدلهای انتشار میپردازیم، که بسیاری از مدلهای پیشرفته تولید تصویر مانند DALL.E 2 و Stable Diffusion را هدایت میکند.
در نهایت، در قسمت سوم، ما بر اساس این پایهها میسازیم تا عملکرد درونی مدلهای پیشرفته را برای تولید تصویر، نوشتن، آهنگسازی و یادگیری تقویتی مبتنی بر مدل بررسی کنیم:
در فصل 9 کتاب Generative Deep Learning، “ترانسفورماتورها”، نسب و جزئیات فنی مدلهای StyleGAN و همچنین سایر GAN های پیشرفته برای تولید تصویر مانند VQ-GAN را بررسی میکنیم.
در فصل 10، “GAN های پیشرفته”، ما معماری Transformer را در نظر میگیریم، از جمله یک راه حل عملی برای ساختن نسخه GPT خود برای تولید متن.
در فصل 11 کتاب Generative Deep Learning، “تولید موسیقی”، ما توجه خود را به تولید موسیقی، از جمله راهنمای کار با دادههای موسیقی و استفاده از تکنیکهایی مانند Transformers و MuseGAN معطوف میکنیم.
در فصل 12 کتاب Generative Deep Learning، “مدلهای جهانی”، میبینیم که چگونه میتوان از مدلهای مولد در زمینه یادگیری تقویتی با استفاده از مدلهای جهانی و روشهای مبتنی بر ترانسفورماتور استفاده کرد.
در فصل 13 کتاب Generative Deep Learning، «مدلهای چندوجهی»، عملکرد درونی چهار مدل چندوجهی پیشرفته را توضیح میدهیم که بیش از یک نوع داده را شامل میشود، از جمله DALL.E 2، Imagen و Stable Diffusion برای تبدیل متن به تولید تصویر و فلامینگو، یک مدل زبان بصری.
در فصل 14، «نتیجهگیری»، ما نقاط عطف کلیدی هوش مصنوعی مولد تا به امروز را مرور میکنیم و درباره راههایی بحث میکنیم که هوش مصنوعی مولد زندگی روزمره ما را در سالهای آینده متحول خواهد کرد.
سرفصلهای کتاب Generative Deep Learning:
- Foreword
- Preface
- I. Introduction to Generative Deep Learning
- 1. Generative Modeling
- 2. Deep Learning
- II. Methods
- 3. Variational Autoencoders
- 4. Generative Adversarial Networks
- 5. Autoregressive Models
- 6. Normalizing Flow Models
- 7. Energy-Based Models
- 8. Diffusion Models
- III. Applications
- 9. Transformers
- 10. Advanced GANs
- 11. Music Generation
- 12. World Models
- 13. Multimodal Models
- 14. Conclusion
- Index
- About the Author
جهت دانلود کتاب Generative Deep Learning میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.