کتاب Modern Data Architectures with Python: A modern approach to building data ecosystems (معماری دادههای مدرن با پایتون: رویکردی مدرن برای ساخت اکوسیستمهای داده) علم معماری دادهی مدرن در علوم رایانه را با استفاده از زبان پایتون را در 4 قسمت به صورت کاربردی بیان میکند.
در ادامه مقدمهای از کتاب Modern Data Architectures with Python را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Modern Data Architectures with Python:
سلام! سکوهای داده در همه جا ظاهر میشوند، اما فقط برخی از ماشینهای موجود در فروشگاه یکسان هستند. ما در طلوع میبینیم که بیشتر دادهها نه در مراکز داده متعلق به شرکت، بلکه در فضای ابری ذخیره شده اند. فضای ذخیره سازی ابری بسیار ارزان است و این فراوانی فضای ذخیره سازی ارزان انتخابهای ما را هدایت میکند.
فضای ذخیرهسازی ابری ارزان است و پردازش ابری اغلب به طور قابل توجهی مقرون به صرفه تر از قرار دادن رایانههای مناسب در یک مرکز داده است. با این افزایش قابلیت ابری ارزان و قابل گسترش، انعطافپذیری را به همراه دارد – توانایی رشد و کوچک شدن در صورت نیاز. موتورهای محاسباتی مجازی مستقیماً روی ماشینهای فیزیکی کار نمیکنند، بلکه در انتزاعهایی به نام کانتینر اجرا میشوند و امکان استفاده موقت را فراهم میکنند. دیگر نیازی به پرداخت هزینه سختافزار گرانقیمت یادگیری عمیق ندارید. ابر میتواند با کسری از هزینه به شما دسترسی سریع بدهد.
گام بعدی در این تکامل، کنار هم قرار دادن پشتههایی از فناوری بود که به خوبی در سکوی دادهای نامیده میشد. این اغلب با فناوریهای ناسازگاری همراه بود که مجبور به همکاری با یکدیگر میشدند، و بارها نیاز به چسب نواری داشت تا همه چیز با هم کار کند. با گذشت زمان، انتخاب بهتری ظاهر شد.
بیشتر بخوانید: کتاب Modern Deep Learning for Tabular Data
با ظهور فناوریهای باز برای پردازش دادهها مانند Apache Spark، ما شروع به دیدن مسیر متفاوتی کردیم. مردم شروع به پرسیدن سوالات اساسی کردند.
سکوی شما به طور کامل از چه نوع دادههایی پشتیبانی میکند؟ به طور فزاینده ای مهم شد که پلت فرم داده شما به طور یکسان از دادههای نیمه ساختاریافته و ساخت یافته پشتیبانی کند. سکوی شما از چه نوع تحلیل و ML پشتیبانی میکند؟ ما شروع به ایجاد، آموزش و استقرار هوش مصنوعی و ML در سکوهای داده خود با استفاده از پشتههای ابزار مدرن کردیم. تجزیه و تحلیل باید به زبانهای مختلف و گزینههای ابزار موجود باشد، نه فقط یک مسیر سنتی JDBC SQL.
چقدر خوب از استریم پشتیبانی میکند؟ جریان دادهها در بسیاری از شرکتها بیش از پیش عادی شده است. همراه با آن جهش قابل توجهی در پیچیدگی ایجاد میشود. سیستمی که برای پردازش، ذخیره و کار با سکوهای استریم ساخته شده است، برای بسیاری حیاتی است.
آیا سکوی شما فقط از استانداردهای باز استفاده میکند؟ استانداردهای باز ممکن است یک فکر بعدی به نظر برسند، اما توانایی تعویض فناوریهای قدیمی بدون جابجایی اجباری و جابجایی می تواند صرفه جویی قابل توجهی در هزینهها باشد. استانداردهای باز به فناوریهای مختلف اجازه میدهند بدون هیچ تلاشی با هم کار کنند، که در تضاد کامل با بسیاری از سیستمهای داده بسته است. این کتاب بهعنوان راهنمای تمام سؤالات عمل میکند و نشان میدهد که باید با سکوهای داده کارآمد کار کنید.
کتاب Modern Data Architectures with Python برای چه کسی است؟
دادهها در هر کسب و کار و محیط کاری وجود دارد. مردم دائما در تلاش برای درک و استفاده بهتر از دادهها هستند.
کتاب Modern Data Architectures with Python دارای سه مخاطب مختلف است:
• مهندسان: مهندسان ساخت محصولات داده و زیرساخت میتوانند از درک چگونگی ساخت سکوهای داده باز مدرن بهرهمند شوند
• تحلیلگران: تحلیلگرانی که میخواهند دادهها را بهتر درک کنند و از آن برای تصمیمگیریهای حیاتی استفاده کنند، از درک نحوه تعامل بهتر با آنها سود خواهند برد.
• مدیران: تصمیمگیرندگانی که بررسیها را مینویسند و دادهها را مصرف میکنند، اغلب باید سکوهای داده را از سطح بالایی بهتر درک کنند، که فوقالعاده مهم است.
آنچه کتاب Modern Data Architectures with Python پوشش میدهد:
فصل 1، معماری مدرن پردازش داده، مقدمه مهمی برای طراحی معماری داده و درک انواع موتورهای پردازش داده ارائه میدهد.
فصل 2 کتاب Modern Data Architectures with Python، درک تجزیه و تحلیل دادهها، یک نمای کلی از دنیای تجزیه و تحلیل دادهها و مدل سازی برای انواع مختلف داده ارائه میدهد.
فصل 3، Apache Spark Deep Dive، درک کاملی از نحوه کار Apache Spark و دانش پس زمینه مورد نیاز برای نوشتن کد Spark ارائه میدهد.
فصل 4، پردازش دسته ای و جریانی با آپاچی اسپارک، پایه محکمی برای کار با Spark برای بارهای کاری دسته ای و خطوط لوله دادههای جریان ساخت یافته فراهم میکند.
فصل 5 کتاب Modern Data Architectures with Python، جریان دادهها با کافکا، مقدمهای عملی درباره کافکا و کاربردهای آن در خطوط لوله داده، از جمله کافکا کانکت و آپاچی اسپارک، ارائه میکند.
فصل 6، MLOps، تمام پیشینه و دانش عملی مورد نیاز را برای یک مهندس برای توسعه، آموزش و استقرار مدلهای ML/AI با استفاده از جدیدترین ابزار فراهم میکند.
فصل 7 کتاب Modern Data Architectures with Python، تجسم دادهها و اطلاعات، نحوه توسعه تجسم دادهها و داشبوردهای رایج در پلت فرم داده را توضیح میدهد.
فصل 8، ادغام پیوسته یکپارچه سازی در گردش کار شما، به عمق چگونگی ساخت برنامههای پایتون در یک گردش کار CI با استفاده از GitHub، Jenkins و Databricks میپردازد.
فصل 9، هماهنگسازی جریانهای کاری دادههای شما، تجربه عملی عملی را با گردشهای کاری Databricks ارائه میدهد که به ابزارهای دیگر ارکستراسیون منتقل میشود.
فصل 10، حاکمیت داده، کنترل دسترسی به دادهها و برخورد با مسائل کیفیت داده را بررسی میکند.
فصل 11، ساختن کار زمینی، پایه ای را برای پروژه ما با استفاده از GitHub، Python، Terraform و PyPi در میان دیگران ایجاد میکند.
فصل 12، تکمیل پروژه ما، پروژه ما را تکمیل میکند، اقدامات GitHub، Pre-commit، نمودارهای طراحی و تعداد زیادی پایتون را ایجاد میکند.
سرفصلهای کتاب Modern Data Architectures with Python:
- Cover
- Title Page
- Copyright and Credits
- Dedications
- Contributors
- Table of Contents
- Preface
- Part 1: Fundamental Data Knowledge
- Chapter 1: Modern Data Processing Architecture
- Chapter 2: Understanding Data Analytics
- Part 2: Data Engineering Toolset
- Chapter 3: Apache Spark Deep Dive
- Chapter 4: Batch and Stream Data Processing Using PySpark
- Chapter 5: Streaming Data with Kafka
- Part 3: Modernizing the Data Platform
- Chapter 6: MLOps
- Chapter 7: Data and Information Visualization
- Chapter 8: Integrating Continous Integration into Your Workflow
- Chapter 9: Orchestrating Your Data Workflows
- Part 4: Hands-on Project
- Chapter 10: Data Governance
- Chapter 11: Building out the Groundwork
- Chapter 12: Completing Our Project
- Index
- Other Books You May Enjoy
جهت دانلود کتاب Modern Data Architectures with Python میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.