۲۰۲۴
کتاب Hands-On RAG for Production
بر اساس سطح علمی
پیشرفته
نوع محتوای کتاب
مبتنی بر پروژه
هدف یادگیری
ارتقای شغلی
بر اساس تکنولوژی
یادگیری ماشین
نوع مسیر
پروژه محور
مورد استفاده
هوش مصنوعی / یادگیری ماشین
info نکات مهم قبل از خرید:
- نسخه کتاب فعلی به زبان لاتین میباشد.
- کتاب به صورت محصول میباشد و پس از خرید بلافاصله در دسترس شما قرار میگیرد.
- قبل از خرید، قسمت توضیحات تکمیلی مربوط به هر کتاب را مطالعه کنید.
- در صورت هرگونه سؤال با ایمیل و یا شماره پشتیبانی سایت در تماس باشید.
- درگاه پرداخت رمزارز نیز برای هموطنان خارج از کشور فعال است.
درباره این کتاب
کتاب Hands-On RAG for Production: Design, Develop, and Deploy Production-Ready RAG Applications (آموزش عملی RAG برای محیط تولید: طراحی، توسعه و استقرار اپلیکیشنهای RAG آمادهی تولید) راهنمایی جامع برای مهندسان و معماران نرمافزار است که قصد دارند اپلیکیشنهای Retrieval-Augmented Generation (RAG) را در سطح سازمانی پیادهسازی کنند. کتاب Hands-On RAG for Production که توسط Ofer Mendelevitch و Forrest Bao نوشته شده، خواننده را از طریق مراحل مختلف توسعه، از جمله…
کتابهای پیشنهادی سردبیر
کتابهای پیشنهادی Cross-sell
نظرات کاربران
تجربیات خود را از خواندن این کتاب با دیگران به اشتراک بگذارید.
ثبت نظر جدید
هنوز دیدگاهی ثبت نشده است.
کتاب Hands-On RAG for Production: Design, Develop, and Deploy Production-Ready RAG Applications (آموزش عملی RAG برای محیط تولید: طراحی، توسعه و استقرار اپلیکیشنهای RAG آمادهی تولید) راهنمایی جامع برای مهندسان و معماران نرمافزار است که قصد دارند اپلیکیشنهای Retrieval-Augmented Generation (RAG) را در سطح سازمانی پیادهسازی کنند.
کتاب Hands-On RAG for Production که توسط Ofer Mendelevitch و Forrest Bao نوشته شده، خواننده را از طریق مراحل مختلف توسعه، از جمله دریافت داده، ایجاد بردارهای معنایی (embeddings) و جستجوی برداری، تا تکنیکهای پیشرفتهتری مانند RAG مبتنی بر عامل (agentic RAG)، RAG چندوجهی (multimodal RAG) و GraphRAG راهنمایی میکند.
در ادامه مقدمهای از کتاب Hands-On RAG for Production را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Hands-On RAG for Production:
دموی «RAG ساده» را دیدهاید: چند خط کد پایتون، یک پایگاه دادهٔ برداری، و یک کلید API. در عرض ده دقیقه، چتبات در حال پاسخ دادن به پرسشها بر اساس چند فایل PDF شرکت است. حسش شبیه جادو است.
شاید حتی در شرکتتان قدم بعدی را هم برداشتهاید: یک برنامهٔ تولید مبتنی بر بازیابی (Retrieval-Augmented Generation یا RAG) ساختهاید، آن را روی پلتفرم ابری مورد علاقهتان میزبانی کردهاید و پایگاه دانش خود را به چند صد سند گسترش دادهاید. ظاهر و حس آن شبیه یک برنامهٔ «واقعی» است.
بعد «روز دوم» فرا میرسد.
وقتی کاربران شروع به پرسیدن سؤالهای پیچیدهتر میکنند، آن «جادوی» اولیه کمکم از هم میپاشد. ترکها زمانی نمایان میشوند که برنامهٔ RAG شما با اطمینان کامل یک سیاست نظارتیِ وجودنداشته را توهمسازی میکند، یا در یک وظیفهٔ عیبیابی اشتباه میکند و بهجای یک نقشهٔ فنی مشخص، به یک بروشور بازاریابی عمومی استناد میکند. تنش بالا میگیرد وقتی ذینفعان وارد بحث میشوند: مدیر ارشد اطلاعات (CIO) دربارهٔ امنیت و حریم خصوصی دادهها پاسخ میخواهد، در حالی که تیم تحقیق و توسعه گزارش میدهد که سیستم همچنان نسبت به فلوچارتها و نمودارهای حیاتیِ دفنشده در فایلهای PDF «نابینا» است.
بهزودی متوجه میشوید دقت بازیابیای که برای هزار سند خوب کار میکرد، وقتی حجم دادهها ده یا صد برابر میشود به «نویز معنایی» تبدیل میشود. با گسترش سیستم، دقت کاهش مییابد و همزمان تأخیر پاسخگویی زیر فشار ترافیک واقعی افزایش پیدا میکند. وقتی تقاضای اجتنابناپذیر برای یک ممیزی قابلیت اطمینان مطرح میشود، با واقعیتی ناخوشایند روبهرو میشوید: شما چارچوب ارزیابی تکرارپذیر و مبتنی بر معیار ندارید تا مشخص کند دقیقاً کدام جزء از خط لولهٔ شما در حال خراب شدن است.
این همان «دیوار تولید» است؛ شکاف میان نمونهٔ اولیهٔ RAG (POC) و یک برنامهٔ هوش مصنوعی مقاوم در سطح سازمانی. عبور از آن فقط به پرامپتهای بهتر نیاز ندارد؛ بلکه به یک تغییر بنیادی در دیدگاه نیاز دارد.
گذار از یک دمو به یک برنامه در مقیاس سازمانی، پیدا کردن سوزن در انبار کاه را ساده جلوه میدهد. این کار نیازمند حل پیچیدگی چندوجهی (multimodal)، دستیابی به قابلیت اطمینان آماری سختگیرانه، و مدیریت بار عملیاتی یک سیستم توزیعشدهٔ هوش مصنوعی است. بیشتر پروژهها شکست میخورند چون این گسترهٔ کار را دستکم میگیرند و RAG را بهعنوان یک قابلیت سادهٔ «وصل کن و استفاده کن» میبینند، نه بهعنوان یک رشتهٔ مهندسی در حال تکامل.
آنچه کتاب Hands-On RAG for Production دربارهٔ آن است:
بسیاری از توسعهدهندگان وقتی به «دیوار تولید» میرسند تصور میکنند مشکل از فناوری است. اینطور نیست. مشکل این است که تکنیکهایی که برای ساخت یک دمو استفاده میشوند، اساساً با تکنیکهایی که برای ساخت یک محصول در مقیاس سازمانی لازماند متفاوت هستند.
کتاب Hands-On RAG for Production پلی بر فراز آن شکاف است. ما به چالشهای عملیاتی خاص RAG در محیط تولید میپردازیم. در پایان این مسیر، شما قادر خواهید بود:
- پیادهسازی بازیابی با دقت بالا
فراتر از جستوجوی سادهٔ برداری بروید و از جستوجوی ترکیبی (Hybrid Search)، بازرتبهبندی مرتبطبودن (Relevance Reranking) یا گرافهای دانشی استفاده کنید تا دقت پاسخها برای پرسشهای پیچیده در مقیاس سازمانی تضمین شود.
- حذف توهمها
توهمهای مدلهای زبانی بزرگ (LLM) را با استفاده از گاردریلهای آگاه از بازیابی تشخیص داده و کاهش دهید، در حالی که اطمینان حاصل میکنید سیستم RAG شما برای پایهگذاری پاسخها به جدیدترین دادههای سازمانی دسترسی دارد.
- یکپارچهسازی محتوای چندرسانهای
قابلیتهای سیستم خود را گسترش دهید تا بتواند جدولها، تصاویر، نمودارها و ویدیوها را بهدرستی تفسیر کند و اطلاعات آنها را در پاسخهای RAG ادغام کند.
- ایجاد ارزیابی دقیق
از آزمونهای «بر اساس حس و حال» فاصله بگیرید—این عادت که سه سؤال از چتبات بپرسید و چون پاسخها «به نظر» درست میآیند فرض کنید سیستم کار میکند—و به سمت معیارهای خودکار و تکرارپذیر حرکت کنید که تضمین آماری از قابلیت اطمینان ارائه میدهند.
- بهینهسازی برای دنیای واقعی
تصمیمهای آگاهانه دربارهٔ ساخت در مقابل خرید بگیرید و سیستمهایی را مستقر کنید که بتوانند محدودیتهای تأخیر کاربران واقعی و نیازهای عمیق مشاهدهپذیری (observability) را تحمل کنند.
تمرکز ما بر تابآوری مخصوص RAG است: تبدیل یک دموی شکننده به یک دارایی سازمانیِ مقاوم. در حالی که به پایههای مهندسی سیستمهای عمومی احترام میگذاریم، کتاب Hands-On RAG for Production یک مقدمهٔ عمومی دربارهٔ یکپارچهسازی و تحویل مداوم (CI/CD) یا زیرساخت ابری نیست. در عوض، ما نقشههای عملی برای حل حالتهای خرابی خاص RAG ارائه میدهیم—از بهینهسازی بازیابی با تأخیر کم و دقت بالا گرفته تا مشاهدهپذیری عمیق—و بر طراحی و پیادهسازی سیستمی تمرکز میکنیم که در برابر فشار ترافیک واقعی و آشفتگی دادههای سازمانی قابل مشاهده، قابل اندازهگیری و قابل اعتماد باشد.
این کتاب برای چه کسانی است؟
کتاب Hands-On RAG for Production برای سازندگان در خط مقدم عصر هوش مصنوعی است—مهندسان نرمافزار، مهندسان یادگیری ماشین، و معماران داده که میدانند فاصلهٔ میان یک `pip install` موفق و یک سیستم تولیدی قابل اعتماد با شبهای بیخوابی اندازهگیری میشود.
احتمالاً شما مسئول قرار دادن سیستمهای RAG در مسیر حیاتی سازمان هستید: سیستمهایی که مشتریان، کارکنان و مدیران اکنون به آنها وابستهاند. شما به دنبال یک آموزش دیگر دربارهٔ مهندسی پرامپت نیستید؛ بلکه مسئول کارهای سنگین ساختاری هستید. چه در حال طراحی خط لولهٔ اسناد باشید که با فایلهای PDF پیچیده به مشکل نخورد، چه در حال پیادهسازی گاردریلهایی برای از بین بردن توهمها، یا ساخت چارچوبهای ارزیابی که ثابت کنند سیستم واقعاً کار میکند—کتاب Hands-On RAG for Production راهنمای شماست.
هرچند این متن عمدتاً مهندسی است، اما برای مدیران محصول فنی و معماران نیز نوعی واقعیتسنجی به حساب میآید. اگر شما تعریفکنندهٔ نیازمندیها هستید، باید محدودیتهای مکانیکی سیستمهای RAG و نقش هر مؤلفه در پشتهٔ RAG را درک کنید. کتاب Hands-On RAG for Production شهود فنی لازم را فراهم میکند تا بتوانید میان یک بودجهٔ تأخیر واقعبینانه و یک خیالپردازی تفاوت قائل شوید و وعدهٔ قابلیتهایی را ندهید که قوانین فیزیک و هزینههای محاسباتی اجازهٔ تحققشان را نمیدهند.
کتاب Hands-On RAG for Production برای چه کسانی نیست؟
برای اینکه مطمئن شوید این کتاب با مسیر فعلی شما همخوانی دارد، باید توجه کنید که ما از مبانی مقدماتی عبور کردهایم. این یک راهنمای مهندسی پیشرفته است، نه یک دورهٔ مقدماتی پایتون. فرض میکنیم با ساختارهای اصلی پایتون و الگوهای پایهٔ برنامهنویسی راحت هستید؛ اگر هنوز در حال تشخیص تفاوت بین لیستها و دیکشنریها هستید، احتمالاً عمق فنی پیادهسازیهای ما برایتان بیشتر آزاردهنده خواهد بود تا مفید.
علاوه بر این، نگاه ما کاملاً بر هوش مصنوعی کاربردی متمرکز است، نه نظریهٔ آکادمیک. در حالی که بهطور عمیق به ارکستراسیون و بهینهسازی سیستمهای RAG میپردازیم، وقت زیادی صرف حسابان زیربنایی شبکههای عصبی یا اثباتهای ریاضی معماری ترنسفورمرها نمیکنیم.
در نهایت، کتاب Hands-On RAG for Production به معنای واقعی «عملی» است—قطعهکدهای موجود در سراسر کتاب و مخزن GitHub همراه آن (که شامل نمونهکدهای کامل است) برای درک کامل مطالب ضروریاند. این کتاب برای علاقهمندان «بدون کدنویسی» یا مصرفکنندگان معمولی نوشته نشده است. اگر هدف شما ساخت برنامههای RAG بدون درگیر شدن مستقیم با کد، طراحی سیستم و اشکالزدایی است، احتمالاً این کتاب با انتظارات شما همخوانی نخواهد داشت.
راهنمای مطالعهی کتاب Hands-On RAG for Production
برای اینکه بتوانید بهترین بهره را از این کتاب ببرید، در اینجا خلاصهای از محتوای هر فصل ارائه شده است. اگرچه این کتاب بهگونهای طراحی شده که بهصورت خطی (از ابتدا تا انتها) خوانده شود، اما متخصصان باتجربه میتوانند مستقیماً به سراغ فصلهای بعدی دربارهی ارزیابی، RAG عاملمحور (Agentic RAG) یا بازیابی چندوجهی بروند و از فصلهای ابتدایی بهعنوان مرجع استفاده کنند.
فصل ۱: مقدمهای بر تولید با بازیابی تقویتشده (RAG)
ما با پاسخ به چراییِ استفاده از RAG شروع میکنیم. شما یاد خواهید گرفت که RAG چه تفاوتی با «تنظیم دقیق» (Fine-tuning) دارد، چه مسائل تجاری مهمی را حل میکند و نگاهی کلی به مفاهیم پیشرفتهای مانند RAG عاملمحور و چندوجهی خواهید داشت (که در فصلهای بعدی با جزئیات بیشتری بررسی میشوند).
فصل ۲: پشتهی (Stack) پایهای RAG
این فصل کتاب Hands-On RAG for Production، نقشهی فنی شماست. ما «موتور» RAG را کالبدشکافی میکنیم تا اجزای آن را بررسی کنیم: تحلیل اسناد (Document Parsing)، استراتژیهای قطعهبندی (Chunking)، مدلهای جایگذاری (Embedding)، پایگاههای دادهی برداری و ادغام با مدلهای زبانی بزرگ (LLM). تا پایان این فصل، یک پشتهی RAG دستساز (DIY) خواهید داشت و درک خواهید کرد که هر جزء در زمان ورود دادهها و پرسوجو چه نقشی ایفا میکند.
فصل ۳: مقیاسپذیری پشتهی RAG
توهمات (Hallucinations)، پاسخهای نادرست و گلوگاههای عملکردی، قاتل پروژههای RAG در مقیاس بزرگ هستند. این فصل کتاب Hands-On RAG for Production مستقیماً به این چالشها میپردازد و راهکارهای محافظتی (Guardrails) را برای جلوگیری از پاسخهای ساختگی، بهعلاوهی ارتقای بازیابی (جستجوی ترکیبی، فیلتر کردن فراداده، و رتبهبندی مجدد) که برای عبور از یک دموی ساده به سمت میلیونها سند نیاز دارید، پوشش میدهد.
فصل ۴: استقرار RAG در محیط عملیاتی
تمرکز این فصل کتاب Hands-On RAG for Production بر انتقال از «اثبات مفهوم» (Proof of Concept) به محیط عملیاتی (Production) است؛ شامل انتخاب تامینکننده، رعایت حریم خصوصی دادهها (GDPR/HIPAA) و هزینههای نگهداری در بلندمدت.
فصل ۵: پلتفرم RAG
همه سازمانها نیازی ندارند که یک خط لولهی RAG را از صفر بسازند. در اینجا بحث «خریدن در مقابل ساختن» را بررسی میکنیم و به مزایای پلتفرمهای «RAG بهعنوان سرویس» برای تسریع در ورود به بازار نگاهی میاندازیم.
فصل ۶: ارزیابی برنامهی RAG
اگر نتوانید چیزی را اندازهگیری کنید، نمیتوانید آن را بهبود ببخشید. در این فصل، اهمیت ارزیابی در RAG را بررسی میکنیم. ما به سراغ معیارهای خاص RAG (برای هر دو بخش بازیابی و تولید) و پارادایم «LLM بهعنوان داور» میرویم تا اطمینان حاصل کنیم که پاسخهای شما از نظر واقعی دقیق و مفید هستند.
فصل ۷: از RAG تا عاملهای هوش مصنوعی (AI Agents)
RAG پایه به سرعت در حال تکامل است و از یک بازیابی ایستا به دنیای عاملهای هوش مصنوعی (AI Agents) تبدیل میشود. در این فصل، یاد میگیرید چگونه عاملهای هوش مصنوعی بسازید که میتوانند استدلال کنند، از ابزارها استفاده کنند و برای پرسشها و وظایف پیچیدهی کاربران تصمیم بگیرند.
فصل ۸: RAG چندوجهی (Multimodal RAG)
سازمانهای امروزی فقط با متن کار نمیکنند. این فصل به شما میآموزد که چگونه تصاویر، نمودارها، صوت و ویدیو را با استفاده از مدلهای جایگذاری چندوجهی و مدلهای تبدیل گفتار به متن، وارد خط لولهی RAG خود کنید.
فصل ۹: RAG تقویتشده با دانش
در این فصل کتاب Hands-On RAG for Production، تقاطع گرافهای دانش (Knowledge Graphs) و مدلهای زبانی بزرگ (LLM) را بررسی میکنیم. شما یاد میگیرید چگونه از روابط ساختاریافته برای ارائهی زمینهی (Context) عمیقتر و استدلال بهتر نسبت به جستجوی برداریِ محض استفاده کنید. همچنین با مفهوم GraphRAG و انواع پرسشهایی که برای پاسخگویی به آنها طراحی شده آشنا میشوید و درک عمیقتری از زمانِ مناسب برای ادغام گرافهای دانش در برنامهی RAG خود به دست میآورید.
فصل ۱۰: آیندهی RAG
در فصل پایانی کتاب Hands-On RAG for Production، فراتر از پیادهسازیهای فعلی، به افقِ بهسرعت در حال تغییرِ هوش مصنوعی مولد نگاه میکنیم. ما سیگنالها را از نویز جدا کرده و بررسی میکنیم که RAG چگونه به تکامل خود ادامه میدهد.
سرفصلهای کتاب Hands-On RAG for Production:
- Cover
- Copyright
- Table of Contents
- Foreword by Sharon Zhou
- Foreword by Jim Dowling
- Preface
- Chapter 1. Introduction to Retrieval-Augmented Generation (RAG)
- Chapter 2. The Base RAG Stack
- Chapter 3. Scaling Your RAG Stack
- Chapter 4. Deploying RAG to Production
- Chapter 5. The RAG Platform
- Chapter 6. Evaluating Your RAG Application
- Chapter 7. From RAG to AI Agents
- Chapter 8. Multimodal RAG
- Chapter 9. Knowledge-Enhanced RAG
- Chapter 10. The Future of RAG
- Index
- About the Authors
- Colophon
جهت دانلود کتاب Hands-On RAG for Production میتوانید پس از پرداخت، دریافت کنید.
