کتاب Big Data on Kubernetes: A practical guide to building efficient and scalable data solutions (کلان داده در Kubernetes: راهنمای عملی برای ایجاد راه حل‌های داده کارآمد و مقیاس‌پذیر) توسط یک متخصص داده با تجربه نوشته شده است، شما را در کل فرآیند توسعه خطوط لوله داده مقیاس‌پذیر و انعطاف پذیر با تمرکز بر اجرای عملی هدایت می‌کند.

با شروع با اصول اولیه، به سمت یادگیری نحوه نصب Docker و اجرای اولین برنامه‌های کانتینری خود پیشرفت خواهید کرد. سپس معماری Kubernetes را بررسی کرده و اجزای اصلی آن را درک خواهید کرد.

در ادامه مقدمه‌ای از کتاب Big Data on Kubernetes را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Big Data on Kubernetes:

در دنیای داده‌محور امروز، توانایی پردازش و تحلیل حجم عظیمی از داده‌ها به یک مزیت رقابتی حیاتی برای کسب‌وکارها در صنایع مختلف تبدیل شده است. فناوری‌های بزرگ داده به عنوان ابزارهای قدرتمندی برای مدیریت حجم، سرعت و تنوع فزاینده داده‌ها ظهور کرده‌اند و سازمان‌ها را قادر می‌سازند تا بینش‌های ارزشمندی استخراج کرده و تصمیم‌گیری آگاهانه انجام دهند. با این حال، مدیریت و مقیاس‌بندی این فناوری‌ها می‌تواند یک کار دلهره‌آور باشد و اغلب به زیرساخت و سربار عملیاتی قابل توجهی نیاز دارد.

کوبرنتیز، پلتفرم متن‌باز ارکستراسیون کانتینر، نحوه استقرار و مدیریت برنامه‌ها را متحول کرده است. کوبرنتیز با ارائه رویکرد استاندارد و خودکار برای مدیریت کانتینر، استقرار و مقیاس‌بندی برنامه‌های پیچیده، از جمله بارهای کاری بزرگ داده را ساده کرده است. هدف کتاب Big Data on Kubernetes پر کردن شکاف بین این دو فناوری قدرتمند است و شما را در فرآیند پیاده‌سازی یک معماری بزرگ داده قوی و مقیاس‌پذیر بر روی کوبرنتیز راهنمایی می‌کند.

در طول فصل‌های کتاب Big Data on Kubernetes، شما یک سفر جامع را آغاز خواهید کرد که با اصول اولیه کانتینرها و معماری کوبرنتیز شروع می‌شود. شما یاد خواهید گرفت که چگونه تصاویر داکر را بسازید و استقرار دهید، اجزای اصلی کوبرنتیز را درک کنید و تجربه عملی در راه‌اندازی خوشه‌های محلی و ابری کوبرنتیز کسب کنید. این پایه محکم شما را برای فصل‌های بعدی آماده می‌کند که در آن به دنیای پشته داده مدرن خواهید پرداخت.

کتاب Big Data on Kubernetes شما را با ابزارهای پرکاربرد در اکوسیستم بزرگ داده مانند Apache Spark برای پردازش داده، Apache Airflow برای ارکستراسیون خط لوله و Apache Kafka برای ورود داده‌های بلادرنگ آشنا می‌کند.

شما نه تنها مفاهیم نظری پشت این فناوری‌ها را یاد خواهید گرفت، بلکه تجربه عملی در پیاده‌سازی آن‌ها بر روی کوبرنتیز نیز کسب خواهید کرد. از طریق مجموعه‌ای از تمرین‌ها و پروژه‌های عملی، درک عمیقی از نحوه ساخت و استقرار خطوط لوله داده، پردازش مجموعه داده‌های بزرگ و هماهنگی جریان‌های کاری پیچیده بر روی یک خوشه کوبرنتیز پیدا خواهید کرد.

با پیشرفت کتاب Big Data on Kubernetes، موضوعات پیشرفته‌ای مانند استقرار لایه مصرف داده با ابزارهایی مانند Trino و Elasticsearch و ادغام بارهای کاری هوش مصنوعی مولد با استفاده از Amazon Bedrock را بررسی خواهید کرد. این موضوعات شما را با دانش و مهارت‌های لازم برای ساخت و نگهداری یک معماری بزرگ داده قوی و مقیاس‌پذیر بر روی کوبرنتیز مجهز می‌کند و پردازش، تحلیل و استقرار برنامه‌های تحلیلی داده کارآمد را تضمین می‌کند.

در پایان کتاب Big Data on Kubernetes، درک جامعی از هم‌افزایی بین بزرگ داده و کوبرنتیز به دست خواهید آورد که به شما امکان می‌دهد از قدرت این فناوری‌ها برای ایجاد نوآوری و رشد کسب‌وکار استفاده کنید. این کتاب چه یک مهندس داده، یک متخصص DevOps یا یک علاقه‌مند به فناوری باشید، دانش عملی و تجربه عملی لازم برای پیاده‌سازی و مدیریت موفق بارهای کاری بزرگ داده بر روی کوبرنتیز را در اختیار شما قرار می‌دهد.

کتاب Big Data on Kubernetes برای چه کسانی است؟

اگر شما یک مهندس داده، معمار ابری، متخصص DevOps، مدیر داده یا علم داده، یا علاقه‌مند به فناوری هستید، این کتاب برای شماست. شما باید دارای پیش‌زمینه اولیه در برنامه‌نویسی پایتون و SQL و همچنین دانش اولیه در مورد Apache Spark، Apache Kafka و Apache Airflow باشید. درک اولیه از Docker و Git نیز مفید خواهد بود.

بیشتر بخوانید: کتاب Kubernetes Anti-Patterns

درباره کتاب Big Data on Kubernetes

فصل اول، شروع با کانتینرها

سفری را برای درک کانتینرها و Docker، فناوری‌های بنیادی برای استقرار مدرن برنامه‌ها آغاز می‌کند. شما یاد خواهید گرفت که چگونه Docker را نصب کنید و اولین تصویر کانتینری خود را اجرا کنید و قدرت کانتینریزه کردن را به صورت دست اول تجربه کنید.

علاوه بر این، شما به پیچیدگی‌های Dockerfiles خواهید پرداخت و هنر ساخت تصاویر کانتینری مختصر و کاربردی را فرا خواهید گرفت. از طریق مثال‌های عملی، از جمله ساخت یک API ساده و یک کار پردازش داده با پایتون، تفاوت‌های ظریف کانتینریزه کردن سرویس‌ها و کارها را درک خواهید کرد.

در پایان این فصل از کتاب Big Data on Kubernetes، فرصتی خواهید داشت تا دانش جدید خود را با ساخت کار و API خود تقویت کنید و زمینه را برای یک مجموعه از برنامه‌های کاربردی مبتنی بر کانتینر عملی فراهم کنید.

فصل دوم، معماری کوبرنتیز

شما را با اجزای اصلی تشکیل دهنده معماری کوبرنتیز آشنا می‌کند. شما در مورد اجزای کنترل پلان مانند API server، etcd، scheduler و controller manager و همچنین اجزای نود کارگر مانند kubelet، kube-proxy و زمان اجرای کانتینر یاد خواهید گرفت.

این فصل از کتاب Big Data on Kubernetes، نقش‌ها و مسئولیت‌های هر جزء و نحوه تعامل آن‌ها با یکدیگر برای اطمینان از عملکرد روان یک خوشه کوبرنتیز را توضیح خواهد داد. علاوه بر این، شما درک مفاهیم کلیدی در کوبرنتیز، از جمله podها، استقرارها، سرویس‌ها، کارها، مجموعه‌های ایالتی، حجم‌های پایدار، ConfigMaps و اسرار را به دست خواهید آورد. در پایان این فصل، شما یک پایه محکم در معماری و مفاهیم اصلی کوبرنتیز خواهید داشت و برای تجربه عملی در فصل‌های بعدی آماده خواهید شد.

فصل سوم، دست به کار شدن با کوبرنتیز

شما را در فرآیند استقرار یک خوشه محلی کوبرنتیز با استفاده از kind و یک خوشه مبتنی بر ابر روی AWS با استفاده از Amazon EKS راهنمایی می‌کند. شما پیکربندی حداقل حساب AWS مورد نیاز برای استقرار موفقیت‌آمیز یک خوشه EKS را یاد خواهید گرفت.

پس از راه‌اندازی خوشه‌ها، فرصتی خواهید داشت تا بین استقرار برنامه‌های خود در محیط محلی یا ابری انتخاب کنید. صرف نظر از انتخاب شما، کارهای API و پردازش داده توسعه‌یافته در فصل 1 کتاب Big Data on Kubernetes را مجدداً انجام داده و آن‌ها را در کوبرنتیز مستقر خواهید کرد. این تجربه عملی درک شما از مفاهیم کوبرنتیز را تقویت کرده و شما را برای موضوعات پیشرفته‌تر در فصل‌های بعدی آماده می‌کند.

فصل 4: پشته داده مدرن

فصل چهارم شما را با شناخته‌شده‌ترین طراحی‌های معماری داده، با تمرکز بر معماری لامبدا آشنا می‌کند. شما در مورد ابزارهایی که پشته داده مدرن را تشکیل می‌دهند، که مجموعه‌ای از فناوری‌های استفاده‌شده برای پیاده‌سازی معماری دریاچه (خانه) داده است، یاد خواهید گرفت.

از جمله این ابزارها می‌توان به Apache Spark برای پردازش داده، Apache Airflow برای ارکستراسیون خط لوله داده و Apache Kafka برای جریان رویدادهای بلادرنگ و ورود داده اشاره کرد. این فصل از کتاب Big Data on Kubernetes، یک معرفی مفهومی از این ابزارها و نحوه کارکرد آن‌ها برای ساخت دارایی‌های اصلی فناوری یک معماری دریاچه (خانه) داده ارائه خواهد داد.

فصل 5: پردازش داده بزرگ با Apache Spark

فصل پنجم شما را با Apache Spark، یکی از محبوب‌ترین ابزارها برای پردازش داده‌های بزرگ آشنا می‌کند. شما اجزای اصلی یک برنامه Spark، نحوه مقیاس‌بندی و مدیریت پردازش توزیع‌شده و بهترین شیوه‌ها برای کار با Spark را درک خواهید کرد.

شما با استفاده از هر دو API DataFrames و API Spark SQL، با استفاده از پایتون برای تعامل با Spark، کارهای ساده پردازش داده را پیاده‌سازی خواهید کرد. این فصل از کتاب Big Data on Kubernetes، شما را در نصب Spark به صورت محلی برای اهداف آزمایش راهنمایی می‌کند تا بتوانید قبل از استقرار در مقیاس بزرگ‌تر، تجربه عملی با این ابزار قدرتمند کسب کنید.

فصل 6: Apache Airflow برای ساخت خط لوله‌ها

فصل ششم شما را با Apache Airflow، یک ابزار متن‌باز پرکاربرد برای ارکستراسیون خط لوله داده آشنا می‌کند. شما یاد خواهید گرفت که چگونه Airflow را با استفاده از Docker و Astro CLI نصب کنید و فرآیند راه‌اندازی را ساده کنید.

این فصل از کتاب Big Data on Kubernetes، شما را با ویژگی‌های اصلی Airflow و اپراتورهای پرکاربرد برای کارهای مهندسی داده آشنا می‌کند. علاوه بر این، شما بینش‌هایی در مورد بهترین شیوه‌ها برای ساخت خط لوله‌های داده مقاوم و کارآمد که از قابلیت‌های Airflow به بهترین نحو استفاده می‌کنند، کسب خواهید کرد.

در پایان این فصل، درک جامعی از نحوه هماهنگی جریان‌های کاری پیچیده داده با استفاده از Airflow خواهید داشت، که یک مهارت حیاتی برای هر مهندس داده یا معمار داده‌ای که با داده‌های بزرگ روی کوبرنتیز کار می‌کند، است.

فصل 7: Apache Kafka برای رویدادهای بلادرنگ و ورود داده

فصل هفتم شما را با Apache Kafka، یک پلتفرم جریان رویداد توزیع‌شده که به طور گسترده برای ساخت خط لوله‌های داده بلادرنگ و برنامه‌های جریان استفاده می‌شود، آشنا می‌کند. شما معماری Kafka و نحوه مقیاس‌بندی آن در حالی که مقاوم است، درک خواهید کرد و آن را قادر می‌سازد تا حجم بالایی از داده‌های بلادرنگ را با تأخیر کم مدیریت کند.

شما در مورد طراحی موضوعات توزیع‌شده Kafka که عملکرد قوی آن را برای رویدادهای بلادرنگ پشتیبانی می‌کند، یاد خواهید گرفت. این فصل از کتاب Big Data on Kubernetes، شما را در اجرای Kafka به صورت محلی با Docker و پیاده‌سازی عملیات خواندن و نوشتن اولیه روی موضوعات راهنمایی می‌کند. علاوه بر این، شما استراتژی‌های مختلف برای تکثیر داده و توزیع موضوع را بررسی خواهید کرد و اطمینان حاصل خواهید کرد که می‌توانید خوشه‌های Kafka کارآمد و قابل اعتماد را طراحی و پیاده‌سازی کنید.

فصل 8: استقرار پشته بزرگ داده بر روی کوبرنتیز

فصل هشتم شما را در فرآیند استقرار ابزارهای بزرگ داده که در فصل‌های قبلی آموخته‌اید، بر روی یک خوشه کوبرنتیز راهنمایی می‌کند. شما با ساخت اسکریپت‌های bash برای استقرار اپراتور Spark و اجرای SparkApplications بر روی کوبرنتیز شروع خواهید کرد.

سپس، Apache Airflow را بر روی کوبرنتیز استقرار خواهید داد تا بتوانید خطوط لوله داده را در داخل خوشه هماهنگ کنید. علاوه بر این، Apache Kafka را بر روی کوبرنتیز با استفاده از هر دو تکنیک خوشه گذرا و JBOD استقرار خواهید داد.

خوشه Kafka Connect نیز همراه با کانکتورها برای مهاجرت داده از پایگاه‌های داده SQL به ذخیره‌سازی شی پایدار استقرار خواهد یافت. در پایان این فصل از کتاب Big Data on Kubernetes، شما یک پشته بزرگ داده کاملاً کاربردی که بر روی کوبرنتیز اجرا می‌شود خواهید داشت که آماده برای کاوش و توسعه بیشتر است.

فصل 9: لایه مصرف داده

فصل نهم شما را در فرآیند در دسترس قرار دادن امن داده‌ها برای تحلیلگران کسب‌وکار در یک معماری بزرگ داده مستقر شده بر روی کوبرنتیز راهنمایی می‌کند. شما با کسب یک دید کلی از کار بر روی یک رویکرد مدرن با استفاده از یک “موتور دریاچه داده” به جای انبار داده شروع خواهید کرد.

در این فصل از کتاب Big Data on Kubernetes، شما با Trino برای مصرف داده مستقیماً از یک دریاچه داده از طریق کوبرنتیز آشنا خواهید شد. شما نحوه کار یک موتور دریاچه داده را درک خواهید کرد، آن را در کوبرنتیز استقرار خواهید داد و اجرای و تاریخچه پرس و جو را نظارت خواهید کرد.

علاوه بر این، برای داده‌های بلادرنگ، با Elasticsearch و Kibana برای مصرف داده آشنا خواهید شد. شما این ابزارها را استقرار خواهید داد و یاد خواهید گرفت که چگونه داده‌ها را در آن‌ها ایندکس کنید و چگونه یک تجسم داده ساده با Kibana بسازید.

فصل 10: ساخت یک خط لوله بزرگ داده در کوبرنتیز

فصل دهم شما را در فرآیند استقرار و هماهنگ‌سازی دو خط لوله داده کامل، یکی برای پردازش دسته ای و دیگری برای پردازش بلادرنگ، بر روی یک خوشه کوبرنتیز راهنمایی می‌کند. شما تمام ابزارهایی را که در طول کتاب Big Data on Kubernetes آموخته‌اید، مانند Apache Spark، Apache Airflow، Apache Kafka و Trino، را برای ساخت یک راه حل پیچیده واحد متصل خواهید کرد.

شما این ابزارها را بر روی کوبرنتیز استقرار خواهید داد، کد برای پردازش داده و هماهنگی می‌نویسید و داده‌ها را برای پرس و جو از طریق یک موتور SQL در دسترس قرار می‌دهید. در پایان این فصل از کتاب Big Data on Kubernetes، شما تجربه عملی در ساخت و مدیریت یک خط لوله بزرگ داده جامع بر روی کوبرنتیز خواهید داشت، که اجزای مختلف و فناوری‌ها را در یک معماری منسجم و مقیاس‌پذیر ادغام می‌کند.

فصل ۱۱: هوش مصنوعی مولد بر روی کوبرنتیز

فصل ۱۱ کتاب Big Data on Kubernetes، شما را در فرآیند استقرار یک برنامه هوش مصنوعی مولد بر روی کوبرنتیز با استفاده از Amazon Bedrock به عنوان یک مجموعه سرویس برای مدل‌های بنیادی راهنمایی می‌کند.

شما یاد خواهید گرفت که چگونه برنامه خود را به یک پایگاه دانش که به عنوان یک لایه تولید تقویت‌شده با بازیابی (RAG) عمل می‌کند، متصل کنید که قابلیت‌های مدل هوش مصنوعی را با ارائه دسترسی به منابع اطلاعات خارجی بهبود می‌بخشد.

علاوه بر این، شما کشف خواهید کرد که چگونه اجرای وظایف را توسط مدل‌های هوش مصنوعی با استفاده از عامل‌ها خودکار کنید و یکپارچه‌سازی بی‌دردسر هوش مصنوعی مولد را در جریان کار خود امکان‌پذیر سازید.

در پایان این فصل از کتاب Big Data on Kubernetes، شما درک جامعی از نحوه استفاده از قدرت هوش مصنوعی مولد بر روی کوبرنتیز خواهید داشت و امکانات جدیدی را برای تجربیات شخصی‌سازی‌شده مشتری، دستیارهای هوشمند و تحلیل کسب‌وکار خودکار باز خواهید کرد.

فصل ۱۲: گام بعدی چیست

فصل ۱۲ شما را در مراحل بعدی سفر خود برای تسلط بر داده‌های بزرگ و کوبرنتیز راهنمایی می‌کند. شما مفاهیم و فناوری‌های حیاتی را که برای ساختن راه‌حل‌های قوی و مقیاس‌پذیر بر روی کوبرنتیز ضروری هستند، بررسی خواهید کرد.

این شامل استراتژی‌های نظارت برای هر دو کوبرنتیز و برنامه‌های شما، پیاده‌سازی یک شبکه سرویس برای ارتباط کارآمد، ایمن‌سازی خوشه و برنامه‌های کاربردی، فعال‌سازی مقیاس‌پذیری خودکار، پذیرش شیوه‌های GitOps و CI/CD برای استقرار و مدیریت ساده و کنترل هزینه‌های کوبرنتیز می‌شود.

برای هر موضوع، شما یک مرور کلی و توصیه‌هایی در مورد فناوری‌ها برای بررسی بیشتر دریافت خواهید کرد که به شما امکان می‌دهد دانش و مهارت‌های خود را در این زمینه‌ها افزایش دهید.

سرفصل‌های کتاب Big Data on Kubernetes:

Big Data on Kubernetes
Contributors
About the author
About the reviewer
Preface
Part 1:Docker and Kubernetes
- Chapter 1: Getting Started with Containers
- Chapter 2: Kubernetes Architecture
- Chapter 3: Getting Hands-On with Kubernetes
Part 2: Big Data Stack
- Chapter 4: The Modern Data Stack
- Chapter 5: Big Data Processing with Apache Spark
- Chapter 6: Building Pipelines with Apache Airflow
- Chapter 7: Apache Kafka for Real-Time Events and Data Ingestion
Part 3: Connecting It All Together
- Chapter 8: Deploying the Big Data Stack on Kubernetes
- Chapter 9: Data Consumption Layer
- Chapter 10: Building a Big Data Pipeline on Kubernetes
- Chapter 11: Generative Al on Kubernetes
- Chapter 12: Where to Go from Here
Index
Other Books You May Enjoy

جهت دانلود کتاب Big Data on Kubernetes می‌توانید پس از پرداخت، دریافت کنید.

فرمت کتاب	epub
ویرایش	First
ISBN	978-1-83546-214-0
تعداد صفحات	296
انتشارات	Packt
سال انتشار	2024
حجم	13.85 مگابایت
نویسنده	Neylson Crepalde

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب Big Data on Kubernetes”

کتاب Big Data on Kubernetes

خرید کتاب Big Data on Kubernetes:

مقدمه‌ای بر کتاب Big Data on Kubernetes:

سرفصل‌های کتاب Big Data on Kubernetes:

دیدگاهها

خرید کتاب Big Data on Kubernetes:

دسته‌یندی کتاب‌ها:

کتاب های پیشنهادی:

دسته بندی پیشنهادی

اعتبار ما: