کتاب Data Analytics with Spark Using Python (تجزیه و تحلیل داده ها با اسپارک با استفاده از پایتون) پوشش کاملی از برنامهنویسی Spark اولیه تا پیشرفته و همچنین Spark SQL تا یادگیری ماشین را شامل میشود.
شما یاد خواهید گرفت که چگونه به طور مؤثر همه اشکال داده را با Spark مدیریت کنید: جریان، ساختار یافته، نیمه ساختار یافته و بدون ساختار. در سرتاسر مرورهای مختصر موضوع به سرعت شما را به سرعت بالا میبرد و تمرینات عملی گسترده شما را برای حل مشکلات واقعی آماده میکند.
در ادامه مقدمهای از کتاب Data Analytics with Spark Using Python را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Analytics with Spark Using Python:
Spark در قلب انقلاب مخرب Big Data و نرمافزار منبع باز قرار دارد. علاقه و استفاده از Spark به طور تصاعدی افزایش یافته است، بدون هیچ نشانهای از کاهش. این کتاب شما را گام به گام برای یک شغل موفق در زمینه تجزیه و تحلیل دادههای بزرگ آماده میکند.
تمرکز کتاب Data Analytics with Spark Using Python
این کتاب بر روی مبانی پروژه اسپارک تمرکز میکند، از هسته شروع میشود و به دنبال توسعههای مختلف، پروژههای مرتبط یا فرعی اسپارک و اکوسیستم گستردهتر فناوریهای منبع باز مانند Hadoop، Kafka، Cassandra و موارد دیگر میشود.
اگرچه درک اساسی از مفاهیم Spark که در این کتاب پوشش داده شده است – از جمله زمان اجرا، کلاستر و معماری برنامه – مستقل از زبان و آگنوستیک هستند، اکثر مثالها و تمرینهای برنامهنویسی در این کتاب به زبان پایتون نوشته شدهاند.
Python API for Spark (PySpark) یک محیط برنامهنویسی بصری را برای تحلیلگران داده، مهندسان داده و دانشمندان داده فراهم میکند و به توسعهدهندگان انعطافپذیری و توسعهپذیری Python را با قدرت پردازش توزیع شده و مقیاسپذیری Spark ارائه میدهد.
دامنه کتاب Data Analytics with Spark Using Python بسیار گسترده است و جنبههای Spark را از برنامهنویسی اصلی Spark گرفته تا Spark SQL، Spark Streaming، یادگیری ماشین و موارد دیگر را پوشش میدهد. این کتاب مقدمه و نمای کلی خوبی برای هر موضوع ارائه میدهد – به اندازه کافی بستری برای شما برای ایجاد هر حوزه یا رشته خاصی در پروژه Spark.
چه کسی باید کتاب Data Analytics with Spark Using Python را بخواند؟
این کتاب برای تحلیلگران داده و مهندسانی در نظر گرفته شده است که به دنبال ورود به فضای کلان داده یا تثبیت دانش خود در این زمینه هستند.
تقاضا برای مهندسان دارای مهارت در Big Data و چارچوب پردازش برجسته آن، Spark، در حال حاضر بسیار زیاد است. هدف کتاب Data Analytics with Spark Using Python این است که خوانندگان را برای این بازار کار رو به رشد آماده کند و آنها را با مهارتهایی که کارفرمایان به دنبال آن هستند مسلح کند.
تجربه پایتون برای خوانندگان این کتاب مفید است اما برای خوانندگان این کتاب کاملاً ضروری نیست زیرا پایتون برای هر کسی که تجربه برنامهنویسی داشته باشد کاملاً شهودی است. دانش کاری خوب از تجزیه و تحلیل و دستکاری دادهها نیز مفید خواهد بود. این کتاب به ویژه برای متخصصان انبار داده که علاقهمند به گسترش حرفه خود در حوزه دادههای بزرگ هستند مناسب است.
نحوه استفاده از کتاب Data Analytics with Spark Using Python
این کتاب در دو بخش و هشت فصل تنظیم شده است. بخش اول، \”مبانی اسپارک\” شامل چهار فصل است که برای ایجاد درک کاملی از چیستی اسپارک، نحوه استقرار اسپارک، و نحوه استفاده از اسپارک برای عملیات اصلی پردازش داده طراحی شده است:
فصل ۱، \”معرفی دادههای بزرگ، هدوپ و اسپارک\”، نمای کلی خوبی از اکوسیستم کلان داده، از جمله پیدایش و تکامل پروژه اسپارک ارائه میدهد. ویژگیهای کلیدی پروژه Spark، از جمله اینکه Spark چیست و چگونه استفاده میشود، و همچنین نحوه ارتباط Spark با پروژه Hadoop مورد بحث قرار میگیرد.
فصل ۲، «استقرار Spark»، نحوه استقرار یک Spark Cluster را نشان میدهد، از جمله حالتهای مختلف استقرار خوشه Spark و روشهای مختلفی که میتوانید از Spark استفاده کنید.
فصل ۳، «درک معماری خوشه اسپارک»، نحوه عملکرد خوشهها و برنامههای Spark را مورد بحث قرار میدهد و درک کاملی از نحوه عملکرد Spark ارائه میدهد.
فصل ۴، \”آموزش مبانی برنامهنویسی اسپارک\”، بر بلوکهای سازنده برنامهنویسی اولیه اسپارک با استفاده از API مجموعه دادههای توزیع شده انعطافپذیر (RDD) تمرکز دارد.
بخش دوم، «فراتر از مبانی»، شامل چهار فصل پایانی است که فراتر از هسته Spark به کاربردهای آن در سیستمهای SQL و NoSQL، برنامههای کاربردی جریان، و علم داده و یادگیری ماشین گسترش مییابد:
فصل ۵، «برنامهنویسی پیشرفته با استفاده از Spark Core API»، ساختارهای پیشرفتهای را که برای گسترش، تسریع و بهینهسازی روالهای Spark از جمله متغیرهای مشترک مختلف و مفاهیم و پیادهسازیهای ذخیرهسازی و پارتیشنبندی RDD استفاده میشوند، پوشش میدهد.
فصل ۶، \”برنامهنویسی SQL و NoSQL با Spark\”، ادغام Spark در چشم انداز وسیع SQL و همچنین ادغام آن با فروشگاههای غیر رابطهای را مورد بحث قرار میدهد.
فصل ۷، «پردازش جریان و پیامرسانی با استفاده از Spark»، پروژه استریم اسپارک و شی اصلی DStream را معرفی میکند. همچنین استفاده Spark با سیستمهای پیامرسان محبوب مانند آپاچی کافکا را پوشش میدهد.
فصل ۸، «مقدمهای بر علم داده و یادگیری ماشین با استفاده از Spark»، مقدمهای بر مدلسازی پیشبینی با استفاده از Spark با R و همچنین زیرپروژه Spark MLlib که برای پیادهسازی یادگیری ماشین با Spark استفاده میشود، ارائه میکند.
سرفصلهای کتاب Data Analytics with Spark Using Python:
- Cover Page
- Title Page
- Copyright Page
- Contents at a Glance
- Table of Contents
- About This E-Book
- Preface
- Introduction
- I: Spark Foundations
- 1 Introducing Big Data, Hadoop, and Spark
- 2 Deploying Spark
- 3 Understanding the Spark Cluster Architecture
- 4 Learning Spark Programming Basics
- II: Beyond the Basics
- 5 Advanced Programming Using the Spark Core API
- 6 SQL and NoSQL Programming with Spark
- 7 Stream Processing and Messaging Using Spark
- 8 Introduction to Data Science and Machine Learning Using Spark
- Index
- Code Snippets
جهت دانلود کتاب Data Analytics with Spark Using Python میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.