کتاب Big Data Analytics (تجزیه و تحلیل کلان دادهها: راهنمایی برای دست اندرکاران علم داده که در حال گذار به دادههای بزرگ هستند) از جدیدترین منابع مربوط به کلان داده و مفاهیم مربوط به آن است که در 6 قسمت مختلف به صورت کاربردی به آن خواهد پرداخت.
در ادامه مقدمهای از کتاب Big Data Analytics را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Big Data Analytics:
به طور کلی، این کتاب خواننده را با مفاهیم اساسی تجزیه و تحلیل دادههای بزرگ برای به دست آوردن بینش از مجموعه دادههای بزرگ آشنا میکند. بنابراین، تأکید کتاب بر کاربرد عملی اقتصاد سنجی و تجزیه و تحلیل تجاری، با توجه به مجموعه دادههای بزرگ، و همچنین تمام مراحل مربوط به قبل از تجزیه و تحلیل واقعی دادهها (ذخیره سازی دادهها، واردات دادهها، آمادهسازی دادهها) است.
کتاب Big Data Analytics مطالب نظری و مفهومی را با کاربردهای عملی مفاهیم با استفاده از R و SQL ترکیب میکند. در نتیجه، خواننده دانش اساسی مورد نیاز برای تجزیه و تحلیل مجموعه دادههای بزرگ را هم به صورت محلی و هم در فضای ابری به دست میآورد.
مشکلات عملی مرتبط با تجزیه و تحلیل کلان داده، و همچنین رویکردهای مربوط به حل این مشکلات، به طور کلی در زمینه اقتصاد سنجی کاربردی و تنظیمات تحلیل تجاری در سراسر این کتاب ارائه شده است.
بیشتر بخوانید: کتاب Big Data
این بدان معنی است که من تمایل دارم روی دادههای مشاهده ای تمرکز کنم، که در تحقیقات اقتصاد و تجارت/مدیریت رایج است. علاوه بر این، از نظر تکنیکهای آمار/تحلیل، این زمینه نیاز به تاکید ویژه بر تحلیل رگرسیون دارد، زیرا این رایجترین ابزار آماری مورد استفاده در اقتصادسنجی کاربردی است. در نهایت، زمینه، محدوده مثالها و آموزشها را مشخص میکند.
به طور معمول، هدف یک پروژه علم داده در اقتصاد سنجی کاربردی و تجزیه و تحلیل کسب و کار، استقرار یک مدل یادگیری ماشینی به عنوان بخشی از یک برنامه کاربردی اپلیکیشن یا وب نیست (همانطور که معمولاً در علم داده انجام میشود). در عوض، هدف چنین پروژههایی کسب بینش در مورد یک سوال اقتصادی/کسبوکار/مدیریت خاص به منظور تسهیل تصمیمگیریهای مبتنی بر داده یا توصیههای سیاستی است.
در نتیجه، خروجی چنین پروژههایی (و همچنین آموزشها/نمونههای این کتاب) مجموعهای از آمار است که بینشهای کمی را بهگونهای خلاصه میکند که میتواند در یک سمینار/ارائه تجاری یا یک مقاله دانشگاهی/گزارش تجاری نمایش داده شود.
در نهایت، زمینه بر نحوه ساختار نمونههای کد و آموزشها تأثیر میگذارد. نمونههای کد معمولاً به عنوان بخشی از یک جلسه تعاملی یا در ایجاد اسکریپتهای تحلیلی کوتاه (و نه توسعه برنامههای کاربردی بزرگتر) استفاده میشوند.
کتاب Big Data Analytics در چهار بخش اصلی تنظیم شده است. بخش اول خواننده را با موضوع تجزیه و تحلیل دادههای بزرگ از دیدگاه یک متخصص در اقتصاد تجربی و تحقیقات تجاری آشنا میکند. تفاوتهای بین مشکلات Big P و Big N را پوشش میدهد و راههایی را نشان میدهد که چگونه عملاً به هر یک از آنها رسیدگی کنید.
بخش دوم بر روی ابزارها و سکوهای کار با دادههای بزرگ تمرکز دارد. این بخش با معرفی مجموعه ای از ابزارهای نرم افزاری که به طور گسترده در سراسر کتاب مورد استفاده قرار خواهند گرفت آغاز میشود: (پیشرفته) R و SQL.
سپس مبانی مفهومی محیطهای محاسباتی مدرن و چگونگی اهمیت اجزای سختافزاری مختلف در تجزیه و تحلیل دادههای بزرگ محلی را مورد بحث قرار میدهد، همچنین چگونه سرورهای مجازی در فضای ابری به افزایش مقیاس و مقیاسبندی تحلیلها در زمانی که سختافزار محلی فاقد منابع محاسباتی کافی است کمک میکند.
بخش سوم کتاب Big Data Analytics بر روی اولین مؤلفههای خط لوله داده گسترش مییابد: جمعآوری و ذخیرهسازی دادهها، وارد کردن/ مصرف دادهها، تمیز کردن/تبدیل دادهها، تجمیع دادهها، و تجسم دادههای اکتشافی (با تمرکز ویژه بر سیستمهای اطلاعات جغرافیایی، GIS).
فصلهای این بخش از کتاب Big Data Analytics مفاهیم اساسی مانند رویکرد تقسیم-کاربرد-ترکیب را مورد بحث قرار میدهند و نحوه استفاده از این مفاهیم را در عمل هنگام کار با مجموعه دادههای بزرگ در R نشان میدهند. بسیاری از آموزشها و مثالهای کد نشان میدهند که چگونه میتوان یک کار خاص را پیادهسازی کرد. به صورت محلی و همچنین در فضای ابری با استفاده از ابزارهای نسبتاً ساده.
در نهایت، قسمت چهارم کتاب طیف گستردهای از موضوعات را در اقتصاد سنجی کاربردی مدرن در زمینه دادههای بزرگ، از تخمین رگرسیون ساده و یادگیری ماشین با واحدهای پردازش گرافیکی (GPU) تا اجرای خطوط لوله یادگیری ماشین و تحلیلهای متنی در مقیاس بزرگ پوشش میدهد. روی یک خوشه اسپارک
سرفصلهای کتاب Big Data Analytics:
- Cover
- Half Title
- Series Page
- Title Page
- Copyright Page
- Dedication
- Contents
- Preface
- I. Setting the Scene: Analyzing Big Data
- Introduction
- 1 What is Big in “Big Data”?
- 2 Approaches to Analyzing Big Data
- 3 The Two Domains of Big Data Analytics
- II. Platform: Software and Computing Resources
- Introduction
- 4 Software: Programming with (Big) Data
- 5 Hardware: Computing Resources
- 6 Distributed Systems
- 7 Cloud Computing
- III. Components of Big Data Analytics
- Introduction
- 8 Data Collection and Data Storage
- 9 Big Data Cleaning and Transformation
- 10 Descriptive Statistics and Aggregation
- 11 (Big) Data Visualization
- IV. Application: Topics in Big Data Econometrics
- Introduction
- 12 Bottlenecks in Everyday Data Analytics Tasks
- 13 Econometrics with GPUs
- 14 Regression Analysis and Categorization with Spark and R
- 15 Large-scale Text Analysis with sparklyr
- V. Appendices
- Appendix A: GitHub
- Appendix B: R Basics
- Appendix C: Install Hadoop
- VI. Bibliography and Index
- Bibliography
- Index
جهت دانلود کتاب Big Data Analytics میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.