military_tech پرفروش‌ترین
۲۰۲۴
پیشنهاد سردبیر
انتخاب متخصصین

کتاب Hands-On RAG for Production

اثر Forrest Sheng Bao

category

بر اساس سطح علمی

پیشرفته

category

نوع محتوای کتاب

مبتنی بر پروژه

category

هدف یادگیری

آمادگی ورود به بازار کار

category

بر اساس تکنولوژی

هوش مصنوعی

category

نوع مسیر

پروژه محور

category

مورد استفاده

هوش مصنوعی / یادگیری ماشین

info نکات مهم قبل از خرید:

  • نسخه کتاب فعلی به زبان لاتین می‌باشد.
  • کتاب به صورت محصول می‌باشد و پس از خرید بلافاصله در دسترس شما قرار می‌گیرد.
  • قبل از خرید، قسمت توضیحات تکمیلی مربوط به هر کتاب را مطالعه کنید.
  • در صورت هرگونه سؤال با ایمیل و یا شماره پشتیبانی سایت در تماس باشید.
  • درگاه پرداخت رمزارز نیز برای هموطنان خارج از کشور فعال است.

درباره این کتاب

کتاب Hands-On RAG for Production: Design, Develop, and Deploy Production-Ready RAG Applications (آموزش عملی RAG برای محیط تولید: طراحی، توسعه و استقرار اپلیکیشن‌های RAG آماده‌ی تولید) راهنمایی جامع برای مهندسان و معماران نرم‌افزار است که قصد دارند اپلیکیشن‌های Retrieval-Augmented Generation (RAG) را در سطح سازمانی پیاده‌سازی کنند. کتاب Hands-On RAG for Production که توسط Ofer Mendelevitch و Forrest Bao نوشته شده، خواننده را از طریق مراحل مختلف توسعه، از جمله…

۸۰,۰۰۰ تومان

کتاب‌های پیشنهادی سردبیر

کتاب‌های پیشنهادی Cross-sell

نظرات کاربران

تجربیات خود را از خواندن این کتاب با دیگران به اشتراک بگذارید.

امتیاز کل
star star star star star
از 0 نظر

ثبت نظر جدید

دیدگاهتان را بنویسید

هنوز دیدگاهی ثبت نشده است.

کتاب Hands-On RAG for Production: Design, Develop, and Deploy Production-Ready RAG Applications (آموزش عملی RAG برای محیط تولید: طراحی، توسعه و استقرار اپلیکیشن‌های RAG آماده‌ی تولید) راهنمایی جامع برای مهندسان و معماران نرم‌افزار است که قصد دارند اپلیکیشن‌های Retrieval-Augmented Generation (RAG) را در سطح سازمانی پیاده‌سازی کنند.

کتاب Hands-On RAG for Production که توسط Ofer Mendelevitch و Forrest Bao نوشته شده، خواننده را از طریق مراحل مختلف توسعه، از جمله دریافت داده، ایجاد بردارهای معنایی (embeddings) و جستجوی برداری، تا تکنیک‌های پیشرفته‌تری مانند RAG مبتنی بر عامل (agentic RAG)، RAG چندوجهی (multimodal RAG) و GraphRAG راهنمایی می‌کند.
در ادامه مقدمه‌ای از کتاب Hands-On RAG for Production را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Hands-On RAG for Production:

دموی «RAG ساده» را دیده‌اید: چند خط کد پایتون، یک پایگاه دادهٔ برداری، و یک کلید API. در عرض ده دقیقه، چت‌بات در حال پاسخ دادن به پرسش‌ها بر اساس چند فایل PDF شرکت است. حسش شبیه جادو است.

شاید حتی در شرکتتان قدم بعدی را هم برداشته‌اید: یک برنامهٔ تولید مبتنی بر بازیابی (Retrieval-Augmented Generation یا RAG) ساخته‌اید، آن را روی پلتفرم ابری مورد علاقه‌تان میزبانی کرده‌اید و پایگاه دانش خود را به چند صد سند گسترش داده‌اید. ظاهر و حس آن شبیه یک برنامهٔ «واقعی» است.

بعد «روز دوم» فرا می‌رسد.

وقتی کاربران شروع به پرسیدن سؤال‌های پیچیده‌تر می‌کنند، آن «جادوی» اولیه کم‌کم از هم می‌پاشد. ترک‌ها زمانی نمایان می‌شوند که برنامهٔ RAG شما با اطمینان کامل یک سیاست نظارتیِ وجودنداشته را توهم‌سازی می‌کند، یا در یک وظیفهٔ عیب‌یابی اشتباه می‌کند و به‌جای یک نقشهٔ فنی مشخص، به یک بروشور بازاریابی عمومی استناد می‌کند. تنش بالا می‌گیرد وقتی ذی‌نفعان وارد بحث می‌شوند: مدیر ارشد اطلاعات (CIO) دربارهٔ امنیت و حریم خصوصی داده‌ها پاسخ می‌خواهد، در حالی که تیم تحقیق و توسعه گزارش می‌دهد که سیستم همچنان نسبت به فلوچارت‌ها و نمودارهای حیاتیِ دفن‌شده در فایل‌های PDF «نابینا» است.

به‌زودی متوجه می‌شوید دقت بازیابی‌ای که برای هزار سند خوب کار می‌کرد، وقتی حجم داده‌ها ده یا صد برابر می‌شود به «نویز معنایی» تبدیل می‌شود. با گسترش سیستم، دقت کاهش می‌یابد و همزمان تأخیر پاسخ‌گویی زیر فشار ترافیک واقعی افزایش پیدا می‌کند. وقتی تقاضای اجتناب‌ناپذیر برای یک ممیزی قابلیت اطمینان مطرح می‌شود، با واقعیتی ناخوشایند روبه‌رو می‌شوید: شما چارچوب ارزیابی تکرارپذیر و مبتنی بر معیار ندارید تا مشخص کند دقیقاً کدام جزء از خط لولهٔ شما در حال خراب شدن است.

این همان «دیوار تولید» است؛ شکاف میان نمونهٔ اولیهٔ RAG (POC) و یک برنامهٔ هوش مصنوعی مقاوم در سطح سازمانی. عبور از آن فقط به پرامپت‌های بهتر نیاز ندارد؛ بلکه به یک تغییر بنیادی در دیدگاه نیاز دارد.

گذار از یک دمو به یک برنامه در مقیاس سازمانی، پیدا کردن سوزن در انبار کاه را ساده جلوه می‌دهد. این کار نیازمند حل پیچیدگی چندوجهی (multimodal)، دستیابی به قابلیت اطمینان آماری سخت‌گیرانه، و مدیریت بار عملیاتی یک سیستم توزیع‌شدهٔ هوش مصنوعی است. بیشتر پروژه‌ها شکست می‌خورند چون این گسترهٔ کار را دست‌کم می‌گیرند و RAG را به‌عنوان یک قابلیت سادهٔ «وصل کن و استفاده کن» می‌بینند، نه به‌عنوان یک رشتهٔ مهندسی در حال تکامل.

آنچه کتاب Hands-On RAG for Production دربارهٔ آن است:

بسیاری از توسعه‌دهندگان وقتی به «دیوار تولید» می‌رسند تصور می‌کنند مشکل از فناوری است. این‌طور نیست. مشکل این است که تکنیک‌هایی که برای ساخت یک دمو استفاده می‌شوند، اساساً با تکنیک‌هایی که برای ساخت یک محصول در مقیاس سازمانی لازم‌اند متفاوت هستند.

کتاب Hands-On RAG for Production پلی بر فراز آن شکاف است. ما به چالش‌های عملیاتی خاص RAG در محیط تولید می‌پردازیم. در پایان این مسیر، شما قادر خواهید بود:

  • پیاده‌سازی بازیابی با دقت بالا

فراتر از جست‌وجوی سادهٔ برداری بروید و از جست‌وجوی ترکیبی (Hybrid Search)، بازرتبه‌بندی مرتبط‌بودن (Relevance Reranking) یا گراف‌های دانشی استفاده کنید تا دقت پاسخ‌ها برای پرسش‌های پیچیده در مقیاس سازمانی تضمین شود.

  • حذف توهم‌ها

توهم‌های مدل‌های زبانی بزرگ (LLM) را با استفاده از گاردریل‌های آگاه از بازیابی تشخیص داده و کاهش دهید، در حالی که اطمینان حاصل می‌کنید سیستم RAG شما برای پایه‌گذاری پاسخ‌ها به جدیدترین داده‌های سازمانی دسترسی دارد.

  • یکپارچه‌سازی محتوای چندرسانه‌ای

قابلیت‌های سیستم خود را گسترش دهید تا بتواند جدول‌ها، تصاویر، نمودارها و ویدیوها را به‌درستی تفسیر کند و اطلاعات آن‌ها را در پاسخ‌های RAG ادغام کند.

  • ایجاد ارزیابی دقیق

از آزمون‌های «بر اساس حس و حال» فاصله بگیرید—این عادت که سه سؤال از چت‌بات بپرسید و چون پاسخ‌ها «به نظر» درست می‌آیند فرض کنید سیستم کار می‌کند—و به سمت معیارهای خودکار و تکرارپذیر حرکت کنید که تضمین آماری از قابلیت اطمینان ارائه می‌دهند.

  • بهینه‌سازی برای دنیای واقعی

تصمیم‌های آگاهانه دربارهٔ ساخت در مقابل خرید بگیرید و سیستم‌هایی را مستقر کنید که بتوانند محدودیت‌های تأخیر کاربران واقعی و نیازهای عمیق مشاهده‌پذیری (observability) را تحمل کنند.

تمرکز ما بر تاب‌آوری مخصوص RAG است: تبدیل یک دموی شکننده به یک دارایی سازمانیِ مقاوم. در حالی که به پایه‌های مهندسی سیستم‌های عمومی احترام می‌گذاریم، کتاب Hands-On RAG for Production یک مقدمهٔ عمومی دربارهٔ یکپارچه‌سازی و تحویل مداوم (CI/CD) یا زیرساخت ابری نیست. در عوض، ما نقشه‌های عملی برای حل حالت‌های خرابی خاص RAG ارائه می‌دهیم—از بهینه‌سازی بازیابی با تأخیر کم و دقت بالا گرفته تا مشاهده‌پذیری عمیق—و بر طراحی و پیاده‌سازی سیستمی تمرکز می‌کنیم که در برابر فشار ترافیک واقعی و آشفتگی داده‌های سازمانی قابل مشاهده، قابل اندازه‌گیری و قابل اعتماد باشد.

این کتاب برای چه کسانی است؟

کتاب Hands-On RAG for Production برای سازندگان در خط مقدم عصر هوش مصنوعی است—مهندسان نرم‌افزار، مهندسان یادگیری ماشین، و معماران داده که می‌دانند فاصلهٔ میان یک `pip install` موفق و یک سیستم تولیدی قابل اعتماد با شب‌های بی‌خوابی اندازه‌گیری می‌شود.

احتمالاً شما مسئول قرار دادن سیستم‌های RAG در مسیر حیاتی سازمان هستید: سیستم‌هایی که مشتریان، کارکنان و مدیران اکنون به آن‌ها وابسته‌اند. شما به دنبال یک آموزش دیگر دربارهٔ مهندسی پرامپت نیستید؛ بلکه مسئول کارهای سنگین ساختاری هستید. چه در حال طراحی خط لولهٔ اسناد باشید که با فایل‌های PDF پیچیده به مشکل نخورد، چه در حال پیاده‌سازی گاردریل‌هایی برای از بین بردن توهم‌ها، یا ساخت چارچوب‌های ارزیابی که ثابت کنند سیستم واقعاً کار می‌کند—کتاب Hands-On RAG for Production راهنمای شماست.

هرچند این متن عمدتاً مهندسی است، اما برای مدیران محصول فنی و معماران نیز نوعی واقعیت‌سنجی به حساب می‌آید. اگر شما تعریف‌کنندهٔ نیازمندی‌ها هستید، باید محدودیت‌های مکانیکی سیستم‌های RAG و نقش هر مؤلفه در پشتهٔ RAG را درک کنید. کتاب Hands-On RAG for Production شهود فنی لازم را فراهم می‌کند تا بتوانید میان یک بودجهٔ تأخیر واقع‌بینانه و یک خیال‌پردازی تفاوت قائل شوید و وعدهٔ قابلیت‌هایی را ندهید که قوانین فیزیک و هزینه‌های محاسباتی اجازهٔ تحققشان را نمی‌دهند.

کتاب Hands-On RAG for Production برای چه کسانی نیست؟

برای اینکه مطمئن شوید این کتاب با مسیر فعلی شما همخوانی دارد، باید توجه کنید که ما از مبانی مقدماتی عبور کرده‌ایم. این یک راهنمای مهندسی پیشرفته است، نه یک دورهٔ مقدماتی پایتون. فرض می‌کنیم با ساختارهای اصلی پایتون و الگوهای پایهٔ برنامه‌نویسی راحت هستید؛ اگر هنوز در حال تشخیص تفاوت بین لیست‌ها و دیکشنری‌ها هستید، احتمالاً عمق فنی پیاده‌سازی‌های ما برایتان بیشتر آزاردهنده خواهد بود تا مفید.

علاوه بر این، نگاه ما کاملاً بر هوش مصنوعی کاربردی متمرکز است، نه نظریهٔ آکادمیک. در حالی که به‌طور عمیق به ارکستراسیون و بهینه‌سازی سیستم‌های RAG می‌پردازیم، وقت زیادی صرف حسابان زیربنایی شبکه‌های عصبی یا اثبات‌های ریاضی معماری ترنسفورمرها نمی‌کنیم.

در نهایت، کتاب Hands-On RAG for Production به معنای واقعی «عملی» است—قطعه‌کدهای موجود در سراسر کتاب و مخزن GitHub همراه آن (که شامل نمونه‌کدهای کامل است) برای درک کامل مطالب ضروری‌اند. این کتاب برای علاقه‌مندان «بدون کدنویسی» یا مصرف‌کنندگان معمولی نوشته نشده است. اگر هدف شما ساخت برنامه‌های RAG بدون درگیر شدن مستقیم با کد، طراحی سیستم و اشکال‌زدایی است، احتمالاً این کتاب با انتظارات شما همخوانی نخواهد داشت.

راهنمای مطالعه‌ی کتاب Hands-On RAG for Production

برای اینکه بتوانید بهترین بهره را از این کتاب ببرید، در اینجا خلاصه‌ای از محتوای هر فصل ارائه شده است. اگرچه این کتاب به‌گونه‌ای طراحی شده که به‌صورت خطی (از ابتدا تا انتها) خوانده شود، اما متخصصان باتجربه می‌توانند مستقیماً به سراغ فصل‌های بعدی درباره‌ی ارزیابی، RAG عامل‌محور (Agentic RAG) یا بازیابی چندوجهی بروند و از فصل‌های ابتدایی به‌عنوان مرجع استفاده کنند.

فصل ۱: مقدمه‌ای بر تولید با بازیابی تقویت‌شده (RAG)

ما با پاسخ به چراییِ استفاده از RAG شروع می‌کنیم. شما یاد خواهید گرفت که RAG چه تفاوتی با «تنظیم دقیق» (Fine-tuning) دارد، چه مسائل تجاری مهمی را حل می‌کند و نگاهی کلی به مفاهیم پیشرفته‌ای مانند RAG عامل‌محور و چندوجهی خواهید داشت (که در فصل‌های بعدی با جزئیات بیشتری بررسی می‌شوند).

فصل ۲: پشته‌ی (Stack) پایه‌ای RAG

این فصل کتاب Hands-On RAG for Production، نقشه‌ی فنی شماست. ما «موتور» RAG را کالبدشکافی می‌کنیم تا اجزای آن را بررسی کنیم: تحلیل اسناد (Document Parsing)، استراتژی‌های قطعه‌بندی (Chunking)، مدل‌های جای‌گذاری (Embedding)، پایگاه‌های داده‌ی برداری و ادغام با مدل‌های زبانی بزرگ (LLM). تا پایان این فصل، یک پشته‌ی RAG دست‌ساز (DIY) خواهید داشت و درک خواهید کرد که هر جزء در زمان ورود داده‌ها و پرس‌وجو چه نقشی ایفا می‌کند.

فصل ۳: مقیاس‌پذیری پشته‌ی RAG

توهمات (Hallucinations)، پاسخ‌های نادرست و گلوگاه‌های عملکردی، قاتل پروژه‌های RAG در مقیاس بزرگ هستند. این فصل کتاب Hands-On RAG for Production مستقیماً به این چالش‌ها می‌پردازد و راهکارهای محافظتی (Guardrails) را برای جلوگیری از پاسخ‌های ساختگی، به‌علاوه‌ی ارتقای بازیابی (جستجوی ترکیبی، فیلتر کردن فراداده، و رتبه‌بندی مجدد) که برای عبور از یک دموی ساده به سمت میلیون‌ها سند نیاز دارید، پوشش می‌دهد.

فصل ۴: استقرار RAG در محیط عملیاتی

تمرکز این فصل کتاب Hands-On RAG for Production بر انتقال از «اثبات مفهوم» (Proof of Concept) به محیط عملیاتی (Production) است؛ شامل انتخاب تامین‌کننده، رعایت حریم خصوصی داده‌ها (GDPR/HIPAA) و هزینه‌های نگهداری در بلندمدت.

فصل ۵: پلتفرم RAG

همه سازمان‌ها نیازی ندارند که یک خط لوله‌ی RAG را از صفر بسازند. در اینجا بحث «خریدن در مقابل ساختن» را بررسی می‌کنیم و به مزایای پلتفرم‌های «RAG به‌عنوان سرویس» برای تسریع در ورود به بازار نگاهی می‌اندازیم.

فصل ۶: ارزیابی برنامه‌ی RAG

اگر نتوانید چیزی را اندازه‌گیری کنید، نمی‌توانید آن را بهبود ببخشید. در این فصل، اهمیت ارزیابی در RAG را بررسی می‌کنیم. ما به سراغ معیارهای خاص RAG (برای هر دو بخش بازیابی و تولید) و پارادایم «LLM به‌عنوان داور» می‌رویم تا اطمینان حاصل کنیم که پاسخ‌های شما از نظر واقعی دقیق و مفید هستند.

فصل ۷: از RAG تا عامل‌های هوش مصنوعی (AI Agents)

RAG پایه به سرعت در حال تکامل است و از یک بازیابی ایستا به دنیای عامل‌های هوش مصنوعی (AI Agents) تبدیل می‌شود. در این فصل، یاد می‌گیرید چگونه عامل‌های هوش مصنوعی بسازید که می‌توانند استدلال کنند، از ابزارها استفاده کنند و برای پرسش‌ها و وظایف پیچیده‌ی کاربران تصمیم بگیرند.

فصل ۸: RAG چندوجهی (Multimodal RAG)

سازمان‌های امروزی فقط با متن کار نمی‌کنند. این فصل به شما می‌آموزد که چگونه تصاویر، نمودارها، صوت و ویدیو را با استفاده از مدل‌های جای‌گذاری چندوجهی و مدل‌های تبدیل گفتار به متن، وارد خط لوله‌ی RAG خود کنید.

فصل ۹: RAG تقویت‌شده با دانش

در این فصل کتاب Hands-On RAG for Production، تقاطع گراف‌های دانش (Knowledge Graphs) و مدل‌های زبانی بزرگ (LLM) را بررسی می‌کنیم. شما یاد می‌گیرید چگونه از روابط ساختاریافته برای ارائه‌ی زمینه‌ی (Context) عمیق‌تر و استدلال بهتر نسبت به جستجوی برداریِ محض استفاده کنید. همچنین با مفهوم GraphRAG و انواع پرسش‌هایی که برای پاسخگویی به آن‌ها طراحی شده آشنا می‌شوید و درک عمیق‌تری از زمانِ مناسب برای ادغام گراف‌های دانش در برنامه‌ی RAG خود به دست می‌آورید.

فصل ۱۰: آینده‌ی RAG

در فصل پایانی کتاب Hands-On RAG for Production، فراتر از پیاده‌سازی‌های فعلی، به افقِ به‌سرعت در حال تغییرِ هوش مصنوعی مولد نگاه می‌کنیم. ما سیگنال‌ها را از نویز جدا کرده و بررسی می‌کنیم که RAG چگونه به تکامل خود ادامه می‌دهد.

سرفصل‌های کتاب Hands-On RAG for Production:

  • Cover
  • Copyright
  • Table of Contents
  • Foreword by Sharon Zhou
  • Foreword by Jim Dowling
  • Preface
  • Chapter 1. Introduction to Retrieval-Augmented Generation (RAG)
  • Chapter 2. The Base RAG Stack
  • Chapter 3. Scaling Your RAG Stack
  • Chapter 4. Deploying RAG to Production
  • Chapter 5. The RAG Platform
  • Chapter 6. Evaluating Your RAG Application
  • Chapter 7. From RAG to AI Agents
  • Chapter 8. Multimodal RAG
  • Chapter 9. Knowledge-Enhanced RAG
  • Chapter 10. The Future of RAG
  • Index
  • About the Authors
  • Colophon

جهت دانلود کتاب Hands-On RAG for Production می‌توانید پس از پرداخت، دریافت کنید.