کتاب Big Data and Hadoop: Fundamentals, tools, and techniques for data-driven success – 2nd Edition (کلان داده و هدوپ: مبانی، ابزارها و تکنیکهای موفقیت مبتنی بر داده – ویرایش دوم) مفاهیم کلان داده را با استفاده از ابزار متن باز Apache Hadoop بیان میکند.
در ادامه مقدمهای از کتاب Big Data and Hadoop را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Big Data and Hadoop:
به دنیای دادههای بزرگ خوش آمدید! در چشمانداز مبتنی بر دادههای امروزی، توانایی به کارگیری و پردازش حجم وسیعی از اطلاعات نه تنها به یک دارایی، بلکه به یک ضرورت برای کسبوکارها، محققان و افراد تبدیل شده است.
کتاب Big Data and Hadoop با عنوان دادههای بزرگ و هدوپ: مبانی، ابزارها و تکنیکهای موفقیت مبتنی بر داده، دروازه شما برای درک و تسلط بر قلمرو شگفتانگیز Big Data است.
بیشتر بخوانید: کتاب Hadoop The Definitive Guide
فصل ۱: معرفی و تقاضای کلان داده – در این فصل آغازین، ما سفری را برای کشف مبانی کلان داده آغاز میکنیم. ما به مفهوم Big Data، اهمیت آن در دنیای امروز و تقاضای فزاینده برای راهحلهایی که بتواند چالشهای آن را مدیریت کند، خواهیم پرداخت. همچنین نمونههای صنعتی از نحوه استفاده از دادههای بزرگ و امکانات بیشماری که ارائه میدهد را بررسی خواهیم کرد.
فصل ۲: مدیریت دادههای NoSQL – این فصل از کتاب Big Data and Hadoop، ما را به قلمرو پایگاههای داده NoSQL میبرد و مقدمهای برای این ذخیرههای داده غیرمرتبط ارائه میکند.
ما پایگاههای داده SQL و NoSQL را با هم مقایسه میکنیم، تفاوتهای ظریف سازگاری دادهها را در NoSQL بررسی میکنیم، و به عمق پایگاه داده HBase میپردازیم. علاوه بر این، ما در مورد پارادایم MapReduce و مفاهیم کلیدی مانند پارتیشنبندی و ترکیب بحث خواهیم کرد.
فصل ۳: تکنیک کاهش نقشه – این فصل از کتاب Big Data and Hadoop به یک پارادایم که به طور گسترده در قلمرو محاسبات توزیع شده استفاده میشود، بحث میکند که پردازش مجموعه دادههای گسترده را با کارایی و مقیاسپذیری متحول میکند. این تکنیک که توسط گوگل توسعه داده شده است، به عنوان سنگ بنای حوزه تجزیه و تحلیل دادههای بزرگ عمل میکند.
MapReduce با بهرهگیری از قدرت پردازش موازی و تحمل خطا، تجزیه و تحلیل یکپارچه مجموعه دادههای عظیم را در میان خوشههای توزیع شده امکانپذیر میکند، و آن را به ابزاری محوری در رسیدگی به چالشهای ناشی از حجم روزافزون دادهها در حوزههای مختلف تبدیل میکند.
فصل ۴: مبانی Hadoop – برای ایجاد یک پایه محکم برای سفر خود به فناوریهای دادههای بزرگ، این فصل شما را با اصول Hadoop آشنا میکند.
ما موضوعات ضروری مانند فرمتهای داده، تجزیه و تحلیل دادهها با Hadoop، استراتژیهای مقیاسبندی، و طراحی سیستم فایل توزیع شده هادوپ (HDFS) را پوشش خواهیم داد. مفاهیمی مانند جریان دادهها، Hadoop I/O، فشردهسازی، سریالسازی و ساختارهای داده مبتنی بر فایل Avro به تفصیل مورد بررسی قرار خواهند گرفت.
فصل ۵: نصب Hadoop – استفاده از Hadoop بسیار مهم است، این فصل شما را در فرآیند گام به گام نصب Hadoop بر روی پلتفرمهای مختلف راهنمایی میکند. چه از اوبونتو استفاده میکنید یا یک سیستم Hadoop کاملاً توزیع شده را راهاندازی میکنید، این فصل از کتاب Big Data and Hadoop دستورالعملهای مفصلی را برای کمک به شما برای شروع ارائه میکند.
فصل ۶: برنامههای MapReduce – این فصل همه چیز در مورد MapReduce است، یک مدل برنامهنویسی اساسی برای پردازش دادههای بزرگ. ما به شما کمک میکنیم تا اصول پشت MapReduce را درک کنید، روش سنتی استفاده از آن را راهنمایی کنید و گردش کار MapReduce را توضیح دهید.
فصل ۷: ابزارهای مرتبط با Hadoop-I: HBase و Cassandra – این فصل از کتاب Big Data and Hadoop شما را با دو ابزار مهم در اکوسیستم کلان داده آشنا میکند: HBase و Cassandra. شما نحوه نصب HBase را کشف خواهید کرد، معماری مفهومی آن را کشف کرده و بینش عملی در مورد اجرای آن به دست خواهید آورد.
ما همچنین به تفاوتهای کلیدی HBase با پایگاه دادههای رابطهای سنتی خواهیم پرداخت. سپس این فصل تمرکز خود را به کاساندرا تغییر میدهد، مدل دادههای آن را توضیح میدهد، مثالهایی ارائه میکند و در مورد ادغام آن با Hadoop بحث میکند.
فصل ۸: Hadoop Related Tool-II: PigLatin و HiveQL – دو ابزار ضروری دیگر را معرفی میکند: PigLatin و HiveQL. شما یاد خواهید گرفت که چگونه PigLatin را نصب کنید، انواع اجرای آن را درک کنید و مدل داده Pig را بررسی کنید.
ما همچنین شما را از طریق توسعه و آزمایش اسکریپتهای PigLatin راهنمایی میکنیم. در مرحله بعد، ما به Hive میپردازیم و انواع دادهها، فرمتهای فایل آن را بررسی میکنیم و HiveQL را با زبانهای جستجوی پایگاه داده سنتی مقایسه میکنیم.
فصل نهم: موضوعات عملی و پژوهش محور – این فصل از کتاب Big Data and Hadoop، به موضوعات عملی و پژوهش محور در دنیای دادههای بزرگ اختصاص دارد.
شما برنامههای کاربردی دنیای واقعی مانند تجزیه و تحلیل دادهها با X، استفاده از فیلترهای بلوم در MapReduce، استفاده از خدمات وب آمازون، تجزیه و تحلیل اسناد آرشیو شده از نیویورک تایمز، داده کاوی تلفن همراه، و تشخیص Hadoop را بررسی خواهید کرد.
فصل ۱۰: Spark – همانطور که ما سفر خود را از طریق دادههای بزرگ و فناوریهای مرتبط به پایان میرسانیم، این فصل Apache Spark را معرفی میکند، یک چارچوب قدرتمند برای پردازش دادههای توزیع شده. ما قابلیتهای آن را بررسی میکنیم و میفهمیم که چگونه با چشمانداز Big Data مطابقت دارد و زمینه را برای ماجراجویی بعدی شما در پردازش دادهها فراهم میکنیم.
این کتاب به گونهای طراحی شده است که درک جامعی از فناوریهای کلان داده در اختیار شما قرار دهد و شما را قادر میسازد تا با چالشهای دنیای واقعی مقابله کنید و از فرصتهای ارائه شده توسط دنیای همیشه در حال گسترش دادهها استفاده کنید. چه دانشجو باشید، چه حرفهای یا یک کاوشگر کنجکاو، امیدواریم این کتاب شما را به دانش و مهارتهایی مجهز کند تا در عصر دادههای بزرگ پیشرفت کنید.
می گویند: خطا کردن انسان است، بخشش الهی. در این راستا آرزو می کنم که کاستی های کتاب بخشیده شود. در عین حال پذیرای هر نوع انتقاد و پیشنهاد سازنده برای بهبود بیشتر هستم.
خواندن مبارک و پردازش داده شاد!
سرفصلهای کتاب Big Data and Hadoop:
- Cover
- Title Page
- Copyright Page
- Dedication Page
- About the Author
- About the Reviewer
- Acknowledgement
- Preface
- Table of Contents
- 1. Big Data Introduction and Demand
- 2. NoSQL Data Management
- 3. MapReduce Technique
- 4. Basics of Hadoop
- 5. Hadoop Installation
- 6. MapReduce Applications
- 7. Hadoop Related Tools-I: HBase and Cassandra
- 8. Hadoop Related Tools-II: PigLatin and HiveQL
- 9. Practical and Research-based Topics
- 10. Spark Index
جهت دانلود کتاب Big Data and Hadoop میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.