military_tech پرفروش‌ترین
۲۰۲۴

پیشنهاد سردبیر

کتاب Dataproc Cookbook

اثر Anuyogam Venkataraman, Narasimha Sadineni

category

نوع محتوای کتاب

راهنمای مرجع

category

هدف یادگیری

حل مسئله عملی

category

نوع مسیر

مرجع / کتابچه راهنما

category

بر اساس تکنولوژی

علوم داده

category

بر اساس سطح علمی

متوسط

info نکات مهم قبل از خرید:

نسخه کتاب فعلی به زبان لاتین می‌باشد.
کتاب به صورت محصول می‌باشد و پس از خرید بلافاصله در دسترس شما قرار می‌گیرد.
قبل از خرید، قسمت توضیحات تکمیلی مربوط به هر کتاب را مطالعه کنید.
در صورت هرگونه سؤال با ایمیل و یا شماره پشتیبانی سایت در تماس باشید.
درگاه پرداخت رمزارز نیز برای هموطنان خارج از کشور فعال است.

درباره این کتاب

کتاب Dataproc Cookbook: Running Spark and Hadoop Workloads in Google Cloud (کتاب راهنمای Dataproc: اجرای بارهای کاری اسپارک و هدوپ در گوگل کلود) راهنمایی عملی برای استقرار و مدیریت حجم کاری Spark و Hadoop در سرویس Dataproc گوگل کلاود ارائه می‌دهد. کتاب Dataproc Cookbook با تمرکز بر رویکرد “دستور پخت” (cookbook)، مجموعه‌ای از مثال‌های کاربردی و راه‌حل‌های گام به گام را برای وظایف رایج مانند پیکربندی خوشه‌ها، اجرای jobها، بهینه‌سازی…

۳۶,۰۰۰ تومان

کتاب‌های پیشنهادی این تخصص:

کتاب A+

۳۱,۰۰۰ تومان

کتاب Django 5 By Example

۳۰,۰۰۰ تومان

کتاب AI Engineering

۳۰,۰۰۰ تومان

کتاب +Network

۳۵,۰۰۰ تومان

کتاب C# 13 and .NET 9

۳۰,۰۰۰ تومان

کتاب‌های پیشنهادی این دسته‌بندی:

کتاب Data Analytics with Spark Using Python

۲۰,۰۰۰ تومان

کتاب The Self-Taught Cloud Computing Engineer

۲۸,۰۰۰ تومان

نظرات کاربران

تجربیات خود را از خواندن این کتاب با دیگران به اشتراک بگذارید.

—

امتیاز کل

star star star star star

از 0 نظر

ثبت نظر جدید

دیدگاهتان را بنویسید

هنوز دیدگاهی ثبت نشده است.

کتاب Dataproc Cookbook با تمرکز بر رویکرد “دستور پخت” (cookbook)، مجموعه‌ای از مثال‌های کاربردی و راه‌حل‌های گام به گام را برای وظایف رایج مانند پیکربندی خوشه‌ها، اجرای jobها، بهینه‌سازی عملکرد و ادغام با سایر سرویس‌های Google Cloud ارائه می‌کند.

کتاب Dataproc Cookbook برای مهندسان داده و توسعه‌دهندگانی طراحی شده که به دنبال بهره‌برداری از قدرت فریم‌ورک‌های بیگ دیتا در محیط ابری مقیاس‌پذیر و مدیریت‌شده Dataproc هستند.

در ادامه مقدمه‌ای از کتاب Dataproc Cookbook را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Dataproc Cookbook:

به گوگل کلود دیتاسبز خوش آمدید! ما از اینکه شما وارد دنیای گوگل کلود دیتاپراک می‌شوید، بسیار هیجان‌زده‌ایم. چرا اینقدر ذوق‌زده‌ایم؟ چون مدیریت کارآمد مجموعه داده‌های عظیم دیگر فقط یک نیاز اولیه نیست – این موتور اصلی است که نوآوری‌های مهم امروزی را نیرو می‌بخشد، از تحلیل‌های عمیق تجاری گرفته تا پیشرفت‌های باورنکردنی در هوش مصنوعی. حتی در حالی که هوش مصنوعی سرتیتر اخبار را به خود اختصاص داده است، حقیقت اساسی همچنان پابرجاست: کیفیت، ساختار و دسترسی‌پذیری داده‌های شما موفقیت هر ابتکار تحلیلی، یادگیری ماشین یا هوش مصنوعی را تعیین می‌کند. هرچه داده‌های شما تمیزتر و در دسترس‌تر باشند، بینش‌ها و مزایای بیشتری می‌توانید به دست آورید.

تکامل سیستم‌های توزیع‌شده برای پردازش داده از محدودیت‌های ماشین‌های مجازی (VM) منفرد، از طریق قدرت سیستم‌های پردازش موازی عظیم (MPP) تخصصی، تا پیشرفت انقلابی هادوپ با استفاده از خوشه‌های سخت‌افزاری عمومی پیشرفت کرده است – تغییری که مقیاس داده‌هایی را که می‌توانستیم مدیریت کنیم، اساساً بازتعریف کرد.

فناوری‌هایی مانند آپشن هادوپ (MapReduce, HDFS, Hive) به ما امکان دادند تا مشکلات داده را در مقیاسی که قبلاً غیرقابل تصور بود، و در چارچوب‌های زمانی عملی، حل کنیم. اسپارک با قابلیت‌های پردازش درون حافظه خود، مرزها را حتی بیشتر جابجا کرد و عملیات داده در مقیاس بزرگ را در عرض چند ثانیه امکان‌پذیر ساخت.

با این حال، مدیریت زیرساخت‌های اصلی برای این ابزارهای قدرتمند اغلب موانع قابل توجهی را ایجاد می‌کرد – چرخه‌های طولانی خرید سخت‌افزار، سرمایه‌گذاری‌های سنگین اولیه و نگهداری پیچیده. اینجاست که ابر، و به طور خاص پلتفرم گوگل کلود (GCP)، وارد صحنه می‌شود و یک تغییر پارادایم را ارائه می‌دهد. دسترسی به سخت‌افزارهای پیشرفته مانند جدیدترین GPUها، افزایش یا کاهش منابع در عرض چند دقیقه به جای چند ماه، و اتخاذ یک مدل هزینه منعطف و پرداخت به ازای استفاده را تصور کنید. این چابکی انقلابی است!

گوگل کلود دیتاپراک دقیقاً در قلب این تقاطع هیجان‌انگیز قرار دارد. این سرویس مدیریت‌شده‌ای را فراهم می‌کند که به شما امکان می‌دهد بارهای کاری هادوپ و اسپارک (و ابزارهای دیگر مانند Flink و Presto) را به طور یکپارچه بر روی زیرساخت قدرتمند GCP اجرا کنید. این به این معنی است که می‌توانید برنامه‌های موجود را با حداقل تغییرات کد، منتقل کنید، از بار مدیریت زیرساخت رها شوید و به جای آن بر استخراج ارزش از داده‌های خود تمرکز کنید. دیتاپراک استفاده از قدرت و انعطاف‌پذیری ابر را برای بارهای کاری داده‌های بزرگ فوق‌العاده ساده می‌کند – و این چیزی است که واقعاً هیجان‌انگیز است!

تا کنون، منابع عملی و یکپارچه فراتر از مستندات رسمی کمیاب بوده‌اند، و این کتاب قصد دارد راهنمای قطعی شما باشد. کتاب Dataproc Cookbook مملو از دستورالعمل‌های عملی و آزمایش‌شده، راهنمای شما برای کشف قدرت واقعی دیتاپراک در دنیای واقعی است. در حالی که تمرکز اصلی ما دیتاپراک است، اصول اساسی گوگل کلود که در اینجا بررسی می‌شوند – از جمله سازماندهی منابع، IAM (مدیریت هویت و دسترسی)، لاگ‌برداری، نظارت و امنیت – دانش ارزشمند و قابل انتقالی را در سراسر اکوسیستم GCP فراهم می‌کنند. بیایید برای مهار قابلیت‌های گوگل کلود دیتاپراک برای داده‌های شما غواصی کنیم.

چه کسانی باید کتاب Dataproc Cookbook را بخوانند؟

این یک کتاب راهنمای مفید در مورد دیتاپراک است که به شما کمک می‌کند مهاجرت هادوپ و سفر یادگیری دیتاپراک خود را تسریع کنید و بارهای کاری خود را بهینه سازید. کتاب Dataproc Cookbook برای مهندسان داده، دانشمندان داده، معماران ابری و موارد دیگر طراحی شده است:

مهندسان داده: متخصصانی که مسئول طراحی، ساخت و نگهداری خطوط پردازش داده با استفاده از دیتاپراک هستند. این کتاب به شما کمک می‌کند تا درباره ویژگی‌های مختلف، بهترین شیوه‌ها و تکنیک‌های بهینه‌سازی برای مدیریت جریان‌های کاری داده‌های بزرگ بیاموزید.
دانشمندان داده: محققان و تحلیلگرانی که با مجموعه داده‌های بزرگ کار می‌کنند و نیاز به انجام تحلیل‌های پیشرفته و وظایف یادگیری ماشین دارند. کتاب Dataproc Cookbook به شما کمک می‌کند تا نحوه استفاده از قابلیت‌های دیتاپراک برای پردازش و تحلیل کارآمد داده‌ها را درک کنید.
معماران ابری: متخصصانی که مسئول طراحی و پیاده‌سازی راه‌حل‌های پردازش داده در پلتفرم گوگل کلود هستند. کتاب Dataproc Cookbook به شما کمک می‌کند تا نحوه ادغام دیتاپراک با سایر سرویس‌ها و معماری‌ها را برای ایجاد سیستم‌های پردازش داده مقیاس‌پذیر و کارآمد درک کنید.
تحلیلگران داده: افرادی که با داده‌ها کار می‌کنند تا بینش‌هایی را به دست آورند و تصمیمات تجاری آگاهانه بگیرند. کتاب Dataproc Cookbook به شما کمک می‌کند تا نحوه استفاده از قابلیت‌های دیتاپراک برای پردازش و تبدیل داده‌ها برای تحلیل و گزارش‌دهی را بیاموزید.
دانشجویان و محققان: افرادی که در حال مطالعه مهندسی داده، علم داده یا رشته‌های مرتبط هستند و می‌خواهند درک جامعی از فناوری‌های پردازش داده و نحوه استفاده مؤثر از دیتاپراک به دست آورند.
مدیران فناوری اطلاعات و تصمیم‌گیرندگان: مدیران اجرایی و مدیرانی که مسئول تصمیم‌گیری در مورد زیرساخت داده و راه‌حل‌های پردازش هستند. کتاب Dataproc Cookbook به شما کمک می‌کند تا مزایا، هزینه‌ها و موارد استفاده از اتخاذ دیتاپراک برای سازمان خود را درک کنید.

چرا کتاب Dataproc Cookbook را نوشتیم؟

شرکت‌ها بارهای کاری داده‌های بزرگ خود را به گوگل کلود منتقل می‌کنند و اغلب از دیتاپراک به عنوان گام اولیه مهم در این سفر از محیط‌های داخلی استفاده می‌کنند. از طریق تجربه مستقیم ما در کمک به شرکت‌های بزرگ برای مهاجرت و ساخت راه‌حل‌های داده‌های بزرگ در گوگل کلود دیتاپراک، ما به طور مداوم نیازی متمایز فراتر از منابع موجود را تشخیص دادیم.

در حالی که دانش بنیادی در مورد هادوپ، اسپارک و GCP به راحتی در دسترس است و مستندات رسمی دیتاپراک ویژگی‌های آن را به طور جامع شرح می‌دهد، ما مشاهده کردیم که تیم‌های تازه‌کار در دیتاپراک در GCP اغلب هنگام تلاش برای ترجمه این اطلاعات به راه‌حل‌های عملی برای کارهای رایج و فوری، احساس سردرگمی می‌کنند.

ما اغلب در طول این پروژه‌ها خودمان به دنبال یک راهنمای متمرکز و عملی بودیم، که مستقیماً الهام‌بخش رویکرد “کتاب آشپزی” این کتاب شد، با تمرکز بر دستورالعمل‌های کد کارآمد برای رایج‌ترین الگوها. هدف اصلی ما پر کردن این شکاف بین تئوری و عمل است، به شما امکان می‌دهد با انجام کارها بیاموزید، از طریق پیاده‌سازی موفقیت‌آمیز اعتماد به نفس کسب کنید، و در نهایت توانایی خود را برای استفاده مؤثر از دیتاپراک در کارهای روزمره خود در گوگل کلود تسریع بخشید.

نحوه پیمایش در کتاب Dataproc Cookbook

این کتاب برای هدایت تدریجی شما از مفاهیم بنیادی به مباحث پیشرفته‌تر و کاربردهای واقعی دیتاپراک ساختار یافته است. در اینجا خلاصه‌ای از آنچه هر فصل پوشش می‌دهد آمده است:

فصل ۱، “ایجاد یک خوشه دیتاپراک”: مقدمه‌ای بر اصول اولیه ایجاد خوشه‌های دیتاپراک در کامپیوتر انجین ارائه می‌دهد.
فصل ۲، “اجرای بارهای کاری Hive، Spark و Sqoop”: شما را از طریق ارسال انواع مختلف jobها (اسپارک، مپ‌ریدیوس و غیره) به خوشه خود راهنمایی می‌کند.
فصل ۳، “پیکربندی پیشرفته خوشه دیتاپراک”: به پیکربندی‌های پیشرفته خوشه مانند خودکارسازی مقیاس، انواع ماشین سفارشی و مدیریت وابستگی‌ها می‌پردازد.
فصل ۴، “اسپارک بدون سرور و خوشه‌های موقت دیتاپراک”: دیتاپراک بدون سرور برای اسپارک را بررسی می‌کند و بر به حداقل رساندن مدیریت زیرساخت و بهینه‌سازی هزینه‌ها تمرکز دارد.
فصل ۵، “دیتاپراک در Google Kubernetes Engine”: نحوه استقرار و مدیریت بارهای کاری دیتاپراک با استفاده از Google Kubernetes Engine (GKE) را با جزئیات شرح می‌دهد.

فصل 5 کتاب Dataproc Cookbook

فصل ۶، “دیتاپراک متادیتاد”: گزینه‌هایی برای مدیریت فراداده، از جمله Hive Metastore و ادغام با سرویس‌هایی مانند دیتاپلکس را پوشش می‌دهد.
فصل ۷، “اتصال از دیتاپراک به سرویس‌های GCP”: مثال‌های عملی از ادغام دیتاپراک با سرویس‌های کلیدی GCP مانند BigQuery و Cloud Storage را ارائه می‌دهد.
فصل ۸، “پیکربندی لاگ‌برداری در دیتاپراک” و فصل ۹، “تنظیم نظارت و داشبوردها”: بر اصول عملی لاگ‌برداری و نظارت بر خوشه‌ها و jobهای دیتاپراک شما تمرکز دارند، مهارت‌هایی که در سراسر GCP قابل استفاده هستند.
فصل ۱۰، “امنیت دیتاپراک”: به جنبه‌های امنیتی حیاتی، از مدیریت اسرار گرفته تا امنیت شبکه با استفاده از VPC Service Controls می‌پردازد.

فصل 10 کتاب Dataproc Cookbook

فصل ۱۱، “بهینه‌سازی عملکرد و هزینه”: استراتژی‌هایی را برای تنظیم پیکربندی خوشه و jobهای دیتاپراک برای به حداکثر رساندن عملکرد و کارایی هزینه ارائه می‌دهد.
فصل ۱۲، “هماهنگ‌سازی بارهای کاری دیتاپراک”: نحوه هماهنگ‌سازی جریان‌های کاری دیتاپراک با استفاده از Cloud Composer را توضیح می‌دهد.
فصل ۱۳، “استفاده از نوت‌بوک‌های اسپارک در دیتاپراک”: بر استفاده از نوت‌بوک‌ها (مانند ژوپیتر، ورک‌بنچ Vertex AI) با دیتاپراک برای تحلیل تعاملی و توسعه هوش مصنوعی/یادگیری ماشین تمرکز دارد.
فصل ۱۴، “مهاجرت از خدمات داخلی و ابری عمومی به GCP”: ملاحظات و استراتژی‌های کلیدی برای مهاجرت بارهای کاری داده‌های بزرگ موجود به دیتاپراک از محیط‌های داخلی یا سایر ابرها را مورد بحث قرار می‌دهد.

فصل 14 کتاب Dataproc Cookbook

سرفصل‌های کتاب Dataproc Cookbook:

Preface
1. Creating a Dataproc Cluster
2. Running Hive, Spark, and Sqoop Workloads
3. Advanced Dataproc Cluster Configuration
4. Serverless Spark and Ephemeral Dataproc Clusters
5. Dataproc on Google Kubernetes Engine
6. Dataproc Metastore
7. Connecting from Dataproc to GCP Services
8. Configuring Logging in Dataproc
9. Setting Up Monitoring and Dashboards
10. Dataproc Security
11. Performance Tuning and Cost Optimization
12. Orchestrating Dataproc Workloads
13. Using Spark Notebooks on Dataproc
14. Migrating from On-Premises and Public Cloud Services to GCP
Index
About the Authors

جهت دانلود کتاب Dataproc Cookbook می‌توانید پس از پرداخت، دریافت کنید.