کتاب Mastering Spark with R آموزش مقدماتی تا پیشرفتهی ابزار Spark به همراه زبان برنامهنویسی R میباشد. این کتاب در 13 فصل شما را در دنیای واقعی علوم داده و کاربردهای آن با ویژگیهای ابزار Spark در کنار زبان برنامهنویسی R آشنا میکند.
در ادامه مقدمهای از کتاب Mastering Spark with R را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Mastering Spark with R:
در دنیایی که اطلاعات به صورت تصاعدی در حال رشد است، ابزارهای پیشرو مانند Apache Spark برای حل بسیاری از مشکلات مرتبطی که امروزه با آن مواجه هستیم، پشتیبانی میکنند. از شرکتهایی که به دنبال راههایی برای بهبود مبتنی بر تصمیمهای مبتنی بر دادهها هستند، تا سازمانهای تحقیقاتی که مشکلات مربوط به مراقبتهای بهداشتی، مالی، آموزش و انرژی را حل میکنند، Spark امکان تجزیه و تحلیل اطلاعات بسیار بیشتر را سریعتر و قابل اعتمادتر از همیشه فراهم میکند.
کتابهای مختلفی برای یادگیری آپاچی اسپارک نوشته شده است. به عنوان مثال، Spark: The Definitive Guide یک منبع جامع است، و Learning Spark یک کتاب مقدماتی است که برای کمک به کاربران در راهاندازی این ابزار میباشد (هر دو از O’Reilly هستند). با این حال، از زمان نگارش این مقاله، نه کتابی برای یادگیری Apache Spark با استفاده از زبان محاسباتی R وجود دارد و نه کتابی که به طور خاص برای کاربر R یا کاربر مشتاق R طراحی شده باشد.
برخی از منابع آنلاین برای یادگیری Apache Spark با R وجود دارد که مهمترین آنها سایت spark.rstudio.com و سایت اسناد Spark در spark.apache.org است. هر دو سایت منابع آنلاین عالی هستند. با این حال، محتوا برای خواندن از ابتدا تا انتها در نظر گرفته نشده است و فرض میکند که شما، خواننده، اطلاعاتی در مورد Apache Spark ،R و محاسبات خوشهای دارید.
هدف این کتاب این است که به همه کمک کند تا با استفاده از R با Apache Spark شروع کنند. علاوه بر این، از آنجا که زبان برنامهنویسی R برای ساده کردن تجزیه و تحلیل دادهها ایجاد شده است، همچنین اعتقاد ما این است که کتاب Mastering Spark with R ساده ترین مسیر را برای یادگیری ابزارهای مورد استفاده برای شما فراهم میکند.
برای حل مشکلات تجزیه و تحلیل دادهها با اسپارک. فصلهای اول مقدمهای را ارائه میکنند تا به هر کسی کمک کند تا با این مفاهیم آشنا شود و ابزارهای مورد نیاز برای کار بر روی این مشکلات را در رایانه شخصی خود ارائه دهد. سپس به سرعت به موضوعات مرتبط با علم داده، محاسبات خوشهای و موضوعات پیشرفته میپردازیم که باید حتی با تجربهترین کاربران را نیز مورد توجه قرار دهند. بنابراین، این کتاب در نظر گرفته شده است که منبع مفیدی برای طیف وسیعی از کاربران، از مبتدیان کنجکاو برای یادگیری Apache Spark تا خوانندگان با تجربهای باشد که به دنبال درک چرایی و نحوه استفاده از Apache Spark از R.
کتاب Mastering Spark with R دارای طرح کلی زیر است:
معرفی
در دو فصل اول، فصل 1، مقدمه، و فصل 2، شروع، با Apache Spark، R و ابزارهای انجام تجزیه و تحلیل دادهها با Spark و R آشنا میشوید.
تحلیل و بررسی
در فصل 3 کتاب Mastering Spark with R، تجزیه و تحلیل، شما یاد میگیرید که چگونه دادهها را در Apache Spark با R تجزیه و تحلیل، کاوش، تبدیل و تجسم کنید.
مدلسازی
در فصل 4، مدلسازی و فصل 5، خطوط لوله، یاد می گیرید که چگونه مدلهای آماری را با هدف استخراج اطلاعات، پیشبینی نتایج، و خودکارسازی این فرآیند در گردشهای کاری آماده تولید ایجاد کنید.
مقیاسبندی
تا این مرحله، کتاب بر روی انجام عملیات بر روی رایانه شخصی شما و با فرمتهای داده محدود متمرکز شده است. فصل 6، خوشهها، فصل 7، اتصالات، فصل 8، دادهها، و فصل 9، تنظیم، تکنیکهای محاسباتی توزیع شده مورد نیاز برای انجام تجزیه و تحلیل و مدلسازی در بسیاری از ماشینها و فرمتهای داده را معرفی میکند تا با دادهها و مشکلات محاسباتی در مقیاس بزرگ مقابله شود. اسپارک طراحی شد.
برنامههای افزودنی
فصل 10 کتاب Mastering Spark with R، برنامههای افزودنی، مؤلفههای اختیاری و قابلیتهای توسعهیافته قابل اعمال برای موارد استفاده خاص و مرتبط را شرح میدهد. شما در مورد چارچوبهای مدل سازی جایگزین، پردازش گراف، پیش پردازش دادهها برای یادگیری عمیق، تجزیه و تحلیل جغرافیایی، و ژنومیک در مقیاس یاد می گیرید.
پیشرفته
کتاب Mastering Spark with R با مجموعهای از فصلهای پیشرفته، فصل 11، R توزیع شده، فصل 12، جریان، و فصل 13، مشارکت، بسته میشود. اینها بیشترین علاقه را برای کاربران پیشرفته خواهد داشت. با این حال، زمانی که به این بخش برسید، محتوا ترسناک به نظر نمی رسد. در عوض، این فصلها به همان اندازه مرتبط، مفید و جالب خواهند بود.
اولین گروه از فصول، 1-5، مقدمهای با زبانی ساده برای انجام علم داده و یادگیری ماشین در مقیاس ارائه میدهد. اگر قصد دارید کتاب Mastering Spark with R را بخوانید و در عین حال نمونههای کد را دنبال کنید، این فصلها عالی هستند که میتوانید کد را خط به خط اجرا کنید. از آنجایی که این فصلها تمام مفاهیم را با استفاده از رایانه شخصی شما آموزش میدهند، شما از چندین رایانه که Spark برای استفاده از آنها طراحی شده است، استفاده نخواهید کرد. اما نگران نباشید: مجموعه فصلهای بعدی این موضوع را با جزئیات آموزش میدهد!
گروه دوم از فصلها، 6-9، مفاهیم اساسی را در دنیای هیجانانگیز محاسبات خوشهای با استفاده از Spark معرفی میکند. صادقانه بگویم، آنها همچنین برخی از بخشهای نه چندان سرگرمکننده رایانش خوشهای را معرفی میکنند، اما باور کنید، ارزش یادگیری مفاهیمی را که ارائه میدهیم دارد. علاوه بر این، بخشهای مروری در هر فصل بهویژه جالب، آموزنده و خواندنی هستند و به شما کمک میکنند تا درک درستی از نحوه کارکرد محاسبات خوشهای داشته باشید.
برای این فصلها، ما در واقع اجرای کد خط به خط را توصیه نمیکنیم – به خصوص اگر میخواهید Spark را از ابتدا تا انتها یاد بگیرید. همیشه میتوانید پس از داشتن یک کلاستر Spark مناسب، برگردید و کد را اجرا کنید. اگر قبلاً یک خوشه در محل کار دارید یا واقعاً برای دریافت آن انگیزه دارید، ممکن است بخواهید از فصل 6 کتاب Mastering Spark with R، برای انتخاب یکی و سپس از فصل 7 برای اتصال به آن استفاده کنید.
گروه سوم از فصلها، 10-13، ابزارهایی را ارائه میدهد که برای اکثر خوانندگان باید کاملاً جالب باشد و دنبال کردن آن را آسانتر میکند. بسیاری از موضوعات پیشرفته ارائه شده است و طبیعی است که به برخی موضوعات بیشتر از سایر موضوعات علاقهمند باشیم.
به عنوان مثال، ممکن است شما علاقهمند به تجزیه و تحلیل مجموعه دادههای جغرافیایی باشید، یا شاید بیشتر به پردازش مجموعه دادههای بلادرنگ علاقهمند باشید، یا شاید بخواهید هر دو را انجام دهید! بر اساس علایق یا مشکلات شخصی شما، ما شما را تشویق میکنیم که نمونه کدهایی را که بیشتر به شما مرتبط هستند را اجرا کنید. تمام کدهای این فصل برای اجرا در رایانه شخصی شما نوشته شده است، اما شما همچنین تشویق میشوید که از خوشههای Spark مناسب استفاده کنید، زیرا ابزارهای مورد نیاز برای عیبیابی مشکلات و تنظیم محاسبات در مقیاس بزرگ را دارید.
همچنین شما میتوانید علاوه بر کتاب Mastering Spark with R، برای آشنایی بیشتر با ابزار Spark به همراه کاربرد آن در تحلیل داده از کتاب Advanced Analytics with PySpark نیز استفاده نمائید.
سرفصلهای کتاب Mastering Spark with R:
- Foreword
- Preface
- 1. Introduction
- 2. Getting Started
- 3. Analysis
- 4. Modeling
- 5. Pipelines
- 6. Clusters
- 7. Connections
- 8. Data
- 9. Tuning
- 10. Extensions
- 11. Distributed R
- 12. Streaming
- 13. Contributing
- A. Supplemental Code References
- Index
فایل کتاب Mastering Spark with R را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.