کتاب LLMs in Production: From language models to successful products (LLMها در تولید: از مدلهای زبانی تا محصولات موفق) یک راهنمای عملی برای ساخت و استقرار مدلهای زبانی بزرگ (LLM) در محیطهای تولیدی است. این کتاب به خوانندگان کمک میکند تا دانش و مهارتهای لازم برای تبدیل مدلهای LLM به محصولات نرمافزاری کاربردی و موفق را کسب کنند.
در ادامه مقدمهای از کتاب LLMs in Production را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب LLMs in Production:
در ژانویه 2023، من کنار یک زوج نشسته بودم که بحث در مورد پدیده جدید، ChatGPT را شروع کردند. شوهر با اشتیاق در مورد اینکه چقدر از این فناوری هیجانزده است صحبت میکرد. او اوقات خوبی را با نوجوانانش صرف نوشتن یک کتاب با استفاده از آن کرده بود – آنها قبلاً 70 صفحه نوشته بودند. با این حال، همسر به اندازه او مشتاق نبود، بیشتر میترسید. او معلم زبان انگلیسی بود و نگران این بود که چگونه قرار است روی دانشآموزانش تأثیر بگذارد.
تقریباً همین موقع بود که شوهر چیزی را گفت که من کاملاً برای آن آماده نبودم: دوستش 100 نویسنده را در شرکتش اخراج کرده بود. فکم افتاد. دوستش صاحب یک وبسایت کوچک بود که در آن نویسندگان آزاد را برای نوشتن مقالات طعنهآمیز، خندهدار و جعلی استخدام میکرد.
پس از نشان دادن این ابزار، دوستش چند عنوان مقاله خود را برداشت و از ChatGPT خواست که یکی را بنویسد. چیزی که ChatGPT نوشت، از هیچ چیز دیگری در وبسایت قابل تشخیص نبود! مقالات بیمعنی که فاقد نیاز به صحت هستند، نان و کره LLMها هستند، بنابراین منطقی بود. میتوانست در عرض چند دقیقه صدها مقاله بنویسد و همه آنها رایگان بودند!
ما از آن زمان تاکنون بارها و بارها این گفتگوی مشابه – با تغییرات جزئی – را تجربه کردهایم. از گروههای دانشجویان کالج گرفته تا اعضای صمیمی جامعه، همه همیشه در مورد هوش مصنوعی صحبت میکنند. افراد بسیار کمی آن را از نزدیک، خارج از پرس و جو از یک API پولی، تجربه کردهاند.
سالهاست که دیدهایم چگونه بر صنعت ترجمه تأثیر گذاشته است. جذب مشتری برای ترجمه سفارشی دشوار است و ظهور گردشهای کاری PEMT (ویرایش پس از ترجمه ماشینی) به مترجمان اجازه داده است که هزینه کمتری دریافت کنند و کار بیشتری را سریعتر، همگی با سطح کیفیت مشابه، انجام دهند. ما مشتاقانه منتظریم که LLMها همین کار را برای بسیاری از مشاغل دیگر انجام دهند.
وقتی ChatGPT برای اولین بار منتشر شد، اساساً هنوز در نسخه بتا برای اهداف تحقیقاتی بود و OpenAI حتی هنوز اشتراکهای پلاس را اعلام نکرده بود. در طول حضور خود در این صنعت، مدلهای یادگیری ماشین زیادی را دیدهایم که با انتشار یک مقاله سفید، پشت یک API قرار گرفتهاند. این به محققان کمک میکند تا اعتبار کسب کنند تا بتوانند یک نسخه نمایشی در حال کار را به نمایش بگذارند.
با این حال، این نسخههای نمایشی فقط همین هستند – هرگز برای مقیاس ساخته نشدهاند و معمولاً پس از یک ماه به دلایل هزینه برداشته میشوند. OpenAI قبلاً چندین بار همین کار را انجام داده بود.
با دیدن مواردی مانند BERT، ELMO، T5، GPT-2 و انبوهی از مدلهای زبانی دیگر که بدون هیچ هیاهویی در خارج از جامعه NLP میآیند و میروند، واضح بود که GPT-3 متفاوت است. LLMها فقط محبوب نیستند. آنها از نظر فنی بسیار دشوار هستند. چالشها و مشکلات زیادی وجود دارد که میتوان هنگام تلاش برای استقرار یکی از آنها با آن روبرو شد و ما دیدهایم که بسیاری از آنها این اشتباهات را مرتکب میشوند. بنابراین وقتی فرصت نوشتن کتاب LLMs in Production پیش آمد، ما همگی مشتاق بودیم. LLMها در تولید کتابی است که همیشه آرزویش را داشتیم.
درباره کتاب LLMs in Production
کتاب «LLMها در تولید» کتاب معمولی علوم داده شما نیست. در واقع، شما کتابهای زیادی مانند این را در فضای داده پیدا نخواهید کرد، عمدتاً به این دلیل که ایجاد یک محصول داده موفق اغلب به یک تیم بزرگ نیاز دارد – دانشمندان داده برای ساخت مدلها، مهندسان داده برای ساخت خطوط لوله، مهندسان MLOps برای ساخت پلتفرمها، مهندسان نرمافزار برای ساخت برنامهها، مدیران محصول برای رفتن به جلسات بیپایان، و، البته، برای هر یک از اینها، مدیران برای گرفتن اعتبار برای همه اینها، علیرغم اینکه تنها مشارکت آنها پرسیدن سؤالات است، اغلب سؤالات تکراری، فقط سعی در درک آنچه در حال رخ دادن است.
کتابهای زیادی برای هر یک از این افراد وجود دارد، اما تعداد بسیار کمی وجود دارد که کل فرآیند را از ابتدا تا انتها به هم مرتبط کنند. در حالی که کتاب LLMs in Production بر LLMها تمرکز دارد – در واقع، میتوان آن را یک کتاب LLMOps در نظر گرفت – آنچه شما برداشت خواهید کرد بسیار بیشتر از نحوه قرار دادن یک مدل بزرگ روی یک سرور خواهد بود. شما یک نقشه راه به دست خواهید آورد که به شما نشان میدهد چگونه محصولات ML موفق – LLM یا غیر آن – را ایجاد کنید که کاربران نهایی را خوشحال کند.
چه کسی باید کتاب LLMs in Production را بخواند؟
هر کسی که خود را در حال کار بر روی برنامهای میبیند که از LLMها استفاده میکند، از کتاب LLMs in Production بهره خواهد برد. این شامل همه افراد ذکر شده قبلی میشود. با این حال، افرادی که بیشترین سود را خواهند برد، احتمالاً کسانی هستند که نقشهای بینگروهی با عناوینی مانند مهندس ML دارند. این کتاب عملی است و ما انتظار داریم که خوانندگانمان پایتون و به ویژه PyTorch را بشناسند.
نحوه سازماندهی کتاب LLMs in Production
این کتاب شامل 12 فصل است که 3 فصل آن، فصلهای پروژه هستند:
- فصل 1 برخی از کاربردهای امیدوارکننده LLMها را ارائه میدهد و در مورد دوگانگی ساخت در مقابل خرید بحث میکند. تمرکز کتاب LLMs in Production نشان دادن نحوه ساخت به شماست، بنابراین میخواهیم به شما کمک کنیم تعیین کنید که آیا ساخت تصمیم درستی برای شما هست یا خیر.
- فصل 2 زمینه لازم را فراهم میکند. ما در مورد اصول اولیه زبانشناسی صحبت میکنیم و برخی از اصطلاحاتی را که برای درک بهتر کتاب LLMs in Production باید بدانید، تعریف میکنیم. سپس دانش خود را از تکنیکهای مدلسازی زبان طبیعی میسازیم. تا پایان این فصل، شما باید هم نحوه عملکرد LLMها و هم آنچه در آن خوب یا بد هستند را درک کنید. سپس باید بتوانید تعیین کنید که آیا LLMها فناوری مناسبی برای پروژه شما هستند یا خیر.
- فصل 3 با توضیح اینکه چرا کار با LLMها بسیار دشوار است، به مشکل اصلی میپردازد. سپس در مورد برخی از مفاهیم و راهحلهای لازم که باید برای شروع کار با LLMها بر آنها مسلط شوید، بحث خواهیم کرد. سپس در مورد الزامات ابزار و زیرساخت لازم که میخواهید به دست آورید و چرایی آن صحبت خواهیم کرد.
- فصل 4 آمادهسازیهای ما را با بحث در مورد داراییهای لازم که باید به دست آورید، از دادهها گرفته تا مدلهای پایه، آغاز میکند.
- فصل 5 سپس به شما نشان میدهد که چگونه یک LLM را از ابتدا آموزش دهید و همچنین روشهای بیشماری برای تنظیم دقیق مدل خود، با بررسی مزایا و معایب هر روش.
- فصل 6 سپس به ارائه LLMها و آنچه برای ایجاد یک API باید بدانید، میپردازد. این فصل از کتاب LLMs in Production در مورد تنظیم یک VPC برای LLMها و همچنین چالشهای رایج تولید و نحوه غلبه بر آنها بحث میکند.
- فصل 7 در مورد مهندسی سریع و چگونگی گرفتن بیشترین پاسخ از پاسخهای LLM بحث میکند.
- فصل 8 ساخت یک برنامه در اطراف یک LLM و ویژگیهایی را که میخواهید برای بهبود تجربه کاربر اضافه کنید، بررسی میکند.
- فصل 9 اولین فصل از فصلهای پروژه ما است، جایی که شما یک مدل ساده LLama 3 را میسازید و آن را مستقر میکنید.
- فصل 10 یک دستیار کدنویسی میسازد که میتوانید مستقیماً در VSCode از آن استفاده کنید.
- فصل 11 پروژهای است که در آن یک LLM را روی یک Raspberry Pi مستقر خواهیم کرد.
- فصل 12 کتاب را با افکار خود در مورد آینده LLMها به عنوان یک فناوری، از جمله بحث در مورد زمینههای امیدوارکننده تحقیق، به پایان میرساند.
به طور کلی، کتاب LLMs in Production به گونهای طراحی شده است که از ابتدا تا انتها خوانده شود، هر فصل از کتاب LLMs in Production بر فصل قبلی بنا میشود. به نظر ما، فصلها به گونهای مرتب شدهاند که یک موقعیت ایدهآل را تقلید کنند و بنابراین دانش مورد نیاز و مراحلی را که هنگام ساخت یک محصول LLM در بهترین شرایط طی میکنید، مشخص میکنند.
با این گفته، این یک کتاب تولیدی است و تولید جایی است که واقعیت در آن زندگی میکند. نگران نباشید؛ ما درک میکنیم که دنیای واقعی آشفته است. هر فصل مستقل است و خوانندگان آزادند و تشویق میشوند که بسته به علایق و سطوح درک خود در آن جابجا شوند.
سرفصلهای کتاب LLMs in Production:
- LLMs in Production
- brief contents
- contents
- foreword
- preface
- acknowledgments
- about the book
- about the authors
- about the cover illustration
- 1 Words’ awakening: Why large language models have captured attention
- 2 Large language models: A deep dive into language modeling
- 3 Large language model operations: Building a platform for LLMs
- 4 Data engineering for large language models: Setting up for success
- 5 Training large language models: How to generate the generator
- 6 Large language model services: A practical guide
- 7 Prompt engineering: Becoming an LLM whisperer
- 8 Large language model applications: Building an interactive experience
- 9 Creating an LLM project: Reimplementing Llama 3
- 10 Creating a coding copilot project: This would have helped you earlier
- 11 Deploying an LLM on a Raspberry Pi: How low can you go?
- 12 Production, an ever-changing landscape: Things are just getting started
- appendix A History of linguistics
- appendix B Reinforcement learning with human feedback
- appendix C Multimodal latent spaces
- index
جهت دانلود کتاب LLMs in Production میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.