کتاب Data Ingestion with Python Cookbook (کتاب راهنمای جذب دادهها با پایتون: راهنمای عملی برای جذب، نظارت و شناسایی خطاها در فرآیند جذب دادهها) در 12 فصل به شرح مفاهیم جذب داده و پیادهسازی آنها با استفاده از زبان برنامهنویسی پایتون خواهد پرداخت.
در ادامه مقدمهای از کتاب Data Ingestion with Python Cookbook را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Ingestion with Python Cookbook:
به کتاب آشپزی Python Ingestion خوش آمدید. امیدوارم شما هم مثل من برای ورود به دنیای مهندسی داده هیجان زده باشید.
مصرف داده با کتاب آشپزی Python یک راهنمای عملی است که شما را قادر میسازد تا خطوط لوله انتقال داده کارآمد را طراحی و اجرا کنید. این کتاب با نمونههای واقعی و ابزارهای منبع باز معروف، به سوالات و موانع شما میپردازد.
با شروع طراحی خطوط لوله، کار با و بدون طرحوارههای داده، ساخت جریانهای کاری نظارتشده با استفاده از جریان هوا، و رعایت اصول مشاهدهپذیری دادهها را در حین رعایت بهترین شیوهها بررسی خواهید کرد. با مقابله با چالشهای خواندن منابع و فرمتهای مختلف داده، به درک جامعی از همه اینها دست خواهید یافت.
سفر ما با بینشهای ضروری در مورد ثبت خطا، شناسایی، وضوح، هماهنگسازی دادهها و نظارت مؤثر ادامه مییابد. روشهای بهینه برای ذخیرهسازی گزارشها، اطمینان از دسترسی آسان و مراجع برای آنها در آینده را کشف خواهید کرد.
در پایان کتاب Data Ingestion with Python Cookbook، شما یک راهاندازی کاملاً خودکار برای شروع مصرف داده و نظارت بر خط لوله خواهید داشت. این فرآیند ساده به طور یکپارچه در مراحل بعدی فرآیند استخراج، تبدیل و بارگذاری (ETL) ادغام میشود و قابلیتهای یکپارچهسازی دادههای شما را به ارتفاعات جدیدی میرساند. برای شروع یک سفر جذب اطلاعات روشنگر و متحول کننده آماده شوید.
کتاب Data Ingestion with Python Cookbook برای چه کسی است؟
این کتاب جامع به طور خاص برای مهندسان داده، متخصصان یکپارچه سازی دادهها، و علاقهمندان به دادههای پرشور طراحی شده است که به دنبال درک عمیق تر از فرآیندهای دریافت داده، جریان دادهها، و چالشهای معمولی هستند که در طول مسیر با آن مواجه میشوند. این بینشهای ارزشمند، بهترین شیوهها و دانش عملی را برای افزایش مهارتها و مهارتهای شما در مدیریت مؤثر وظایف دریافت دادهها ارائه میکند.
چه مبتدی در دنیای داده باشید و چه یک توسعه دهنده با تجربه، این کتاب برای شما مناسب خواهد بود. برای خواندن و اجرای کدهای این کتاب توصیه میشود اصول برنامه نویسی پایتون را بدانید و دانش اولیه Docker را داشته باشید.
آنچه کتاب Data Ingestion with Python Cookbook پوشش میدهد:
فصل 1، مقدمه ای بر جذب داده، شما را با بهترین شیوههای جذب داده و چالشهای کار با منابع دادههای متنوع آشنا می کند. اهمیت ابزارهای پوشش داده شده در کتاب را توضیح میدهد، آنها را ارائه میدهد و دستورالعملهای نصب را ارائه میدهد.
فصل 2 کتاب Data Ingestion with Python Cookbook، اصول دسترسی به داده – دسترسی به دادههای شما، مفاهیم دسترسی به داده مربوط به حاکمیت داده را بررسی می کند، گردش کار و مدیریت منابع آشنا مانند سرورهای SFTP، API ها و ارائه دهندگان ابر را پوشش میدهد. همچنین نمونههایی از ایجاد سیاستهای دسترسی به دادهها در پایگاههای داده، انبارهای داده و ابر ارائه میدهد.
فصل 3، کشف دادهها – درک دادههای ما قبل از مصرف، اهمیت انجام فرآیند کشف دادهها را قبل از جذب دادهها به شما میآموزد. کشف دستی، مستندسازی و استفاده از ابزار منبع باز، OpenMetadata، برای پیکربندی محلی را پوشش میدهد.
فصل 4 کتاب Data Ingestion with Python Cookbook، خواندن فایلهای CSV و JSON و حل مسائل، شما را با دریافت فایلهای CSV و JSON با استفاده از Python و PySpark آشنا میکند. این نشان میدهد که حجم دادهها و زیرساختهای مختلف را در حین رسیدگی به چالشهای رایج و ارائه راه حلها مدیریت میکند.
فصل 5، دریافت دادهها از پایگاههای داده ساختاریافته و بدون ساختار، مفاهیم اساسی پایگاههای داده رابطهای و غیر رابطهای، از جمله موارد استفاده روزمره را پوشش میدهد. شما یاد خواهید گرفت که چگونه دادههای این مدلها را بخوانید و مدیریت کنید، ملاحظات حیاتی را درک کنید و خطاهای احتمالی را عیب یابی کنید.
فصل 6 کتاب Data Ingestion with Python Cookbook، استفاده از PySpark با طرحوارههای تعریفشده و غیر تعریفشده، بیشتر به موارد استفاده رایج PySpark میپردازد، و بر مدیریت طرحوارههای تعریفشده و تعریفنشده تمرکز میکند. همچنین خواندن و درک گزارشهای پیچیده از Spark (هسته PySpark) و تکنیکهای قالب بندی را برای اشکال زدایی آسان تر بررسی میکند.
فصل 7، دریافت دادههای تحلیلی، شما را با دادههای تحلیلی و قالبهای رایج برای خواندن و نوشتن آشنا می کند. این مطالعه خواندن دادههای پارتیشن بندی شده برای بهبود عملکرد را بررسی می کند و نظریه معکوس ETL را با جریانهای کاری برنامههای کاربردی واقعی و نمودارها مورد بحث قرار میدهد.
فصل 8 کتاب Data Ingestion with Python Cookbook، طراحی جریانهای کاری دادههای نظارت شده، بهترین شیوههای ثبت اطلاعات برای دریافت دادهها، تسهیل شناسایی خطا و اشکالزدایی را پوشش میدهد. تکنیکهایی مانند نظارت بر اندازه فایل، تعداد ردیف و شمارش اشیا، نظارت بهتری بر داشبورد، هشدارها و بینشها را امکانپذیر میسازد.
فصل 9، قرار دادن همه چیز در کنار جریان هوا، اطلاعات ارائه شده قبلی را ادغام می کند و شما را در ساخت یک برنامه کاربردی دریافت دادههای واقعی با استفاده از جریان هوا راهنمایی می کند. این اجزای اساسی، پیکربندی و حل مشکل را در فرآیند پوشش میدهد.
فصل 10 کتاب Data Ingestion with Python Cookbook، ثبت و نظارت بر دریافت دادههای شما در جریان هوا، ثبت و نظارت پیشرفته در دریافت دادهها با جریان هوا را بررسی میکند. ایجاد اپراتورهای سفارشی، تنظیم اعلانها و نظارت بر ناهنجاریهای داده را پوشش میدهد. پیکربندی اعلانها برای ابزارهایی مانند Slack نیز برای بهروز ماندن در فرآیند دریافت داده پوشش داده شده است.
فصل 11، اتوماسیون خطوط انتقال دادههای شما، بر خودکارسازی دریافت دادهها با استفاده از بهترین شیوههای قبلاً آموخته شده تمرکز دارد و امکان استقلال خواننده را فراهم میکند. چالشهای رایج با زمانبندیها یا ابزارهای ارکستراسیون را برطرف میکند و راهحلهایی برای جلوگیری از مشکلات در خوشههای تولید ارائه میدهد.
فصل 12 کتاب Data Ingestion with Python Cookbook، استفاده از قابلیت مشاهده دادهها برای اشکالزدایی، مدیریت خطا، و جلوگیری از خرابی، مفاهیم مشاهدهپذیری دادهها، ابزارهای نظارتی رایج مانند Grafana و بهترین شیوهها برای ذخیرهسازی گزارش و سلسله دادهها را بررسی میکند. همچنین ایجاد نمودارهای تجسم را برای نظارت بر مسائل منبع داده با استفاده از پیکربندی جریان هوا و اسکریپتهای جذب داده را پوشش میدهد.
سرفصلهای کتاب Data Ingestion with Python Cookbook:
- Data Ingestion with Python Cookbook
- Contributors
- About the author
- About the reviewers
- Preface
- Part 1: Fundamentals of Data Ingestion
- Chapter 1: Introduction to Data Ingestion
- Chapter 2: Principals of Data Access – Accessing Your Data
- Chapter 3: Data Discovery – Understanding Our Data before Ingesting It
- Chapter 4: Reading CSV and JSON Files and Solving Problems
- Chapter 5: Ingesting Data from Structured and Unstructured Databases
- Chapter 6: Using PySpark with Defined and Non-Defined Schemas
- Chapter 7: Ingesting Analytical Data
- Part 2: Structuring the Ingestion Pipeline
- Chapter 8: Designing Monitored Data Workflows
- Chapter 9: Putting Everything Together with Airflow
- Chapter 10: Logging and Monitoring Your Data Ingest in Airflow
- Chapter 11: Automating Your Data Ingestion Pipelines
- Chapter 12: Using Data Observability for Debugging, Error Handling, and Preventing Downtime
- Index
- Other Books You May Enjoy
جهت دانلود کتاب Data Ingestion with Python Cookbook میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.