کتاب Hands-on Guide to Apache Spark 3 (راهنمای عملی Apache Spark 3: ساخت موتورهای محاسباتی مقیاسپذیر برای پردازش دادههای دستهای و جریانی) در 10 فصل مختلف به شرح کاربرد ابزار Apache Spark و مفاهیم آن در حوزهی رایانش ابری و داده خواهد پرداخت.
در ادامه مقدمهای از کتاب Hands-on Guide to Apache Spark 3 را شرح خواهیم داد.
مقدمهای بر کتاب Hands-on Guide to Apache Spark 3:
این کتاب توضیح میدهد که چگونه میتوان Apache Spark 3 را برای مدیریت حجم عظیمی از دادهها، از طریق پردازش دستهای یا جریانی، مقیاس کرد. نحوه استفاده از APIهای ساختاریافته Spark برای انجام تبدیلهای پیچیده داده و تجزیه و تحلیلهایی را که میتوانید برای پیادهسازی گردشهای کاری تجزیه و تحلیل انتها به انتها استفاده کنید، پوشش میدهد. این کتاب ویژگیهای جدید Spark 3، مبانی نظری و معماری کاربردی را پوشش میدهد.
بخش اول اکوسیستم Apache Spark را به عنوان یک موتور یکپارچه برای تجزیه و تحلیل داده در مقیاس بزرگ معرفی میکند و به شما نشان میدهد که چگونه اولین برنامه خود را در Spark اجرا و تنظیم کنید. بخش دوم بر پردازش دسته ای مناسب برای پردازش پایان چرخه و جذب دادهها از طریق فایلها و پایگاههای داده متمرکز است. Spark DataFrame API و همچنین دادههای ساختاریافته و بدون ساختار را با Apache Spark توضیح میدهد.
بخش آخر به بارهای کاری پردازش جریانی مقیاسپذیر، با توان بالا و تحمل خطا برای پردازش دادههای بلادرنگ میپردازد. در اینجا با مدل اجرای Apache Spark Streaming، معماری Spark Streaming، نظارت، گزارش و بازیابی جریان Spark آشنا خواهید شد. یک فصل کامل به مسیرهای آینده اسپارک استریمینگ اختصاص دارد. این کتاب با موارد استفاده در دنیای واقعی، تکههای کد و نوتبوکهایی که در GitHub میزبانی میشوند، به شما درکی از مفاهیم تجزیه و تحلیل دادههای مقیاس بزرگ میدهد – و به شما کمک میکند از آنها استفاده کنید.
پس از خواندن کتاب Hands-on Guide to Apache Spark 3، دانش و مهارتهایی برای پیادهسازی یکپارچه بارهای کاری دستهای و جریانی در مقیاس بزرگ برای تجزیه و تحلیل جریانهای داده در زمان واقعی با Apache Spark خواهید داشت.
آنچه شما یاد خواهید گرفت:
- به مفاهیم کلاسترهای Spark و پردازش دستهای داده تسلط داشته باشید
- درک دادهها، تبدیل و ذخیره سازی دادهها
- در مورد مفاهیم اساسی پردازش جریان و معماریهای مختلف جریان بینشی به دست آورید
- کارها و برنامههای استریم را با Spark Streaming پیادهسازی کنید
این کتاب برای چه کسی است؟
مهندسان داده، تحلیلگران داده، مهندسان یادگیری ماشین، برنامهنویسان Python و R
سرفصلهای کتاب Hands-on Guide to Apache Spark 3:
- Cover
- Front Matter
- Part I: Apache Spark Batch Data Processing
- Chapter 1: Introduction to Apache Spark for Large-Scale Data Analytics
- Chapter 2: Getting Started with Apache Spark
- Chapter 3: Spark Low-Level API
- Chapter 4: The Spark High-Level APIs
- Chapter 5: Spark Dataset API and Adaptive Query Execution
- Chapter 6: Introduction to Apache Spark Streaming
- Part II: Apache Spark Streaming
- Chapter 7: Spark Structured Streaming
- Chapter 8: Streaming Sources and Sinks
- Chapter 9: Event-Time Window Operations and Watermarking
- Chapter 10: Future Directions for Spark Streaming
- Back Matter
- Bibliography
- Index
جهت دانلود کتاب Hands-on Guide to Apache Spark 3 میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.