کتاب Designing Large Language Model Applications: A Holistic Approach to LLMs (طراحی برنامههای کاربردی مدلهای زبانی بزرگ: یک رویکرد جامع به LLMها) راهنمای جامعی برای درک و استفاده از مدلهای زبانی بزرگ (LLM) است. این کتاب به بررسی اصول عملکرد LLMها، روشهای بهرهبرداری از آنها، و الگوهای مختلف کاربردی میپردازد. نویسنده با ارائه تمرینهای عملی و ارجاع به مقالات تحقیقاتی، خوانندگان را در مسیر تبدیل شدن به متخصصان LLM همراهی میکند.
در ادامه مقدمهای از کتاب Designing Large Language Model Applications را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Designing Large Language Model Applications:
در چند سال گذشته، پیشرفت در حوزه هوش مصنوعی با سرعتی سرسامآور رخ داده است که پیشتاز آن پیشرفتها در مدلهای زبانی بزرگ (LLM) بوده است. چندی پیش، LLMها فناوری نوپایی بودند که برای تولید یک پاراگراف منسجم تلاش میکردند؛ امروزه آنها قادر به حل مسائل پیچیده ریاضی، نوشتن مقالات متقاعدکننده و انجام مکالمات طولانی و جذاب با انسانها هستند.
همزمان با پیشرفت هوش مصنوعی از قدرتی به قدرت دیگر، به سرعت در تار و پود جامعه تنیده میشود و جنبههای بسیاری از زندگی ما را تحت تاثیر قرار میدهد.
یادگیری نحوه استفاده موثر از مدلهای هوش مصنوعی مانند LLMها ممکن است یکی از مفیدترین مهارتهایی باشد که در این دهه باید آموخت. LLMها دنیای نرمافزار را متحول میکنند و امکان توسعه برنامههایی را فراهم کردهاند که قبلاً غیرممکن تلقی میشدند.
با تمام وعدههایی که LLMها به ارمغان میآورند، واقعیت این است که آنها هنوز فناوری بالغی نیستند و محدودیتهای زیادی مانند نقص در استدلال، عدم پایبندی به واقعیت، “توهمات”، مشکلات در هدایت آنها به سمت اهداف ما، مسائل مربوط به سوگیری و انصاف و غیره دارند.
با وجود این محدودیتها، میتوانیم همچنان از LLMها برای استفادههای خوب بهره ببریم و برنامههای کاربردی مفیدی را بسازیم، به شرطی که به طور موثر به کاستیهای آنها رسیدگی کنیم.
چارچوبهای نرمافزاری متعددی ظهور کردهاند که امکان توسعه سریع نمونههای اولیه برنامههای LLM را فراهم میکنند. با این حال، پیشرفت از نمونههای اولیه به برنامههای کاربردی در سطح تولید، مسیری بسیار کمتر پیموده شده و هنوز یک کار بسیار چالشبرانگیز است.
اینجاست که این کتاب وارد میشود—یک نمای کلی جامع از چشمانداز LLM که شهود و ابزارهای لازم برای ساخت برنامههای کاربردی پیچیده LLM را در اختیار شما قرار میدهد.
هدف من از این کتاب، ارائه درک شهودی از نحوه عملکرد LLMها، ابزارهایی که برای بهرهبرداری از آنها در اختیار دارید و الگوهای مختلف کاربردی که میتوان با آنها ساخت، است. ویژگی منحصر به فرد این کتاب تمرینهای آن است؛ بیش از 80 تمرین در سراسر کتاب گنجانده شده است تا به شما در تثبیت شهودتان و تقویت درک شما از آنچه در زیر سطح اتفاق میافتد، کمک کند.
در حین آمادهسازی محتوای کتاب، بیش از 800 مقاله تحقیقاتی را مطالعه کردم که بسیاری از آنها در مکانهای مناسب کتاب ارجاع و لینک داده شدهاند و نقطه شروعی برای کاوش بیشتر در اختیار شما قرار میدهند. در مجموع، اطمینان دارم که اگر کتاب را به طور کامل بخوانید، تمام تمرینها را انجام دهید و منابع پیشنهادی را بررسی کنید، به یک متخصص LLM تبدیل خواهید شد.
کتاب Designing Large Language Model Applications برای چه کسانی مناسب است؟
این کتاب برای مخاطبان گستردهای از جمله مهندسان نرمافزاری که به توسعه برنامههای کاربردی هوش مصنوعی منتقل میشوند، متخصصان و دانشمندان یادگیری ماشین و مدیران محصول در نظر گرفته شده است.
بسیاری از محتوای کتاب Designing Large Language Model Applications از آزمایشهای شخصی من با LLMها نشأت گرفته است، بنابراین حتی اگر یک دانشمند باتجربه هستید، انتظار دارم که در آن ارزشی پیدا کنید. به طور مشابه، حتی اگر آشنایی بسیار محدودی با دنیای هوش مصنوعی دارید، انتظار دارم که همچنان کتاب را برای درک اصول اولیه این فناوری مفید بدانید.
تنها پیشنیازهای این کتاب، دانش کدنویسی پایتون و درک اصول اولیه یادگیری ماشین و یادگیری عمیق است. در صورت نیاز، لینکهایی به منابع خارجی ارائه میکنم که میتوانید از آنها برای تقویت یا توسعه پیشنیازهای خود استفاده کنید.
ساختار کتاب Designing Large Language Model Applications چگونه است؟
این کتاب به 3 بخش با مجموع 13 فصل تقسیم شده است. بخش اول به درک اجزای یک مدل زبانی میپردازد. من قویاً معتقدم که حتی اگر هرگز خودتان یک مدل زبانی را از ابتدا آموزش ندهید، دانستن اینکه چه چیزی در ساخت آن دخیل است، بسیار مهم است.
بخش دوم به بحث در مورد روشهای مختلف بهرهبرداری از مدلهای زبانی، چه با درخواست مستقیم از مدل یا با تنظیم دقیق آن به روشهای مختلف، میپردازد. همچنین به محدودیتهایی مانند توهمات و محدودیتهای استدلال، همراه با روشهایی برای کاهش این مسائل، میپردازد.
در نهایت، بخش سوم کتاب Designing Large Language Model Applications به الگوهای کاربردی مانند تولید تقویتشده با بازیابی (RAG) و عاملها میپردازد و LLMها را در چارچوب گستردهتر یک سیستم نرمافزاری کامل قرار میدهد.
کتاب Designing Large Language Model Applications در مورد چه چیزی نیست؟
برای اینکه حجم کتاب در حد معقولی باشد، برخی از موضوعات خارج از محدوده در نظر گرفته شدند. من مراقب بودهام که موضوعاتی را که اطمینان ندارم در طول زمان ماندگار میشوند، پوشش ندهم. این حوزه بسیار سریع در حال حرکت است، بنابراین نوشتن کتابی که ارتباط خود را در طول زمان حفظ کند، بسیار چالشبرانگیز است.
این کتاب فقط بر روی LLMهای زبان انگلیسی تمرکز دارد و عمدتاً بحث در مورد مدلهای چندزبانه را کنار میگذارد. من همچنین با این ایده که همه زبانهای غیرانگلیسی جهان را تحت عنوان “چندزبانه” جمع کنیم، مخالفم. هر زبان ظرافتهای خاص خود را دارد و شایسته کتاب مخصوص به خود است.
کتاب Designing Large Language Model Applications همچنین مدلهای چندوجهی را پوشش نمیدهد. مدلهای جدید به طور فزایندهای چندوجهی هستند، یعنی یک مدل واحد از چندین وجه مانند متن، تصویر، ویدئو، گفتار و غیره پشتیبانی میکند. با این حال، متن مهمترین وجه باقی میماند و بستر اتصال در این مدلها است. بنابراین، خواندن این کتاب همچنان به شما در آماده شدن برای آینده چندوجهی کمک خواهد کرد.
کتاب Designing Large Language Model Applications بر تئوری تمرکز نمیکند یا خیلی عمیق در ریاضیات فرو نمیرود. کتابهای دیگری وجود دارند که این موضوع را پوشش میدهند و من در صورت نیاز به آنها ارجاع دادهام. این کتاب حاوی حداقل معادلات ریاضی است و در عوض بر ایجاد شهود تمرکز دارد.
این کتاب فقط یک مقدمه مقدماتی برای مدلهای استدلال، جدیدترین الگوی LLM، ارائه میدهد. در زمان نگارش کتاب، مدلهای استدلال هنوز در مراحل ابتدایی خود هستند و هنوز مشخص نیست که کدام تکنیکها مؤثرتر خواهند بود.
چگونه کتاب Designing Large Language Model Applications را بخوانیم؟
بهترین راه برای استفاده از این کتاب، خواندن آن به ترتیب، انجام تمرینها و بررسی لینکهای مرجع است. با این حال، بسته به علایق شما، چند مسیر جایگزین وجود دارد:
اگر علاقه شما به درک چشمانداز LLM است و نه لزوماً ساخت برنامههای کاربردی با آنها، میتوانید بر روی فصلهای 1، 2، 3، 4، 5، 10 و 11 تمرکز کنید.
اگر مدیر محصولی هستید که به دنبال درک دامنه احتمالات برای برنامههای کاربردی LLM هستید، فصلهای 1، 2، 3، 5، 8، 10، 11، 12 و 13 گزینه خوبی هستند.
اگر دانشمند یادگیری ماشین هستید، فصلهای 7، 8، 9، 10، 11 و 12 مطمئناً به شما خوراک فکری و چالشهای تحقیقاتی جدیدی ارائه خواهند داد.
اگر میخواهید LLM خود را از ابتدا آموزش دهید، فصلهای 2، 3، 4، 5 و 7 اصول اولیه را در اختیار شما قرار میدهند.
سرفصلهای کتاب Designing Large Language Model Applications:
- Preface
- I. LLM Ingredients
- 1. Introduction
- 2. Pre-Training Data
- 3. Vocabulary and Tokenization
- 4. Architectures and Learning Objectives
- II. Utilizing LLMs
- 5. Adapting LLMs to Your Use Case
- 6. Fine-Tuning
- 7. Advanced Fine-Tuning Techniques
- 8. Alignment Training and Reasoning
- 9. Inference Optimization
- III. LLM Application Paradigms
- 10. Interfacing LLMs with External Tools
- 11. Representation Learning and Embeddings
- 12. Retrieval-Augmented Generation
- 13. Design Patterns and System Architecture
- Index
- About the Author
جهت دانلود کتاب Designing Large Language Model Applications میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.