کتاب Data Quality Fundamentals

جزئیات بیشتر و خرید محصول:

۲۳,۰۰۰ تومان

توضیحات

کتاب Data Quality Fundamentals (مبانی کیفیت داده: راهنمای پیشرفته برای ایجاد خطوط لوله داده قابل اعتماد) از جدیدترین کتاب‌های حوزه‌ی علوم داده است که در سال 2022 به چاپ رسیده است. این کتاب در 10 فصل به آموزش گام‌به‌گام داده و کیفیت آن خواهد پرداخت.

در ادامه مقدمه‌ای از کتاب Data Quality Fundamentals را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Data Quality Fundamentals:

اگر هر یک از سناریوهای زیر را تجربه کرده‌اید، دست خود را بالا بیاورید (یا، فقط می‌توانید به نشانه همبستگی سری تکان دهید – هیچ راهی وجود ندارد که در غیر این صورت متوجه شویم):

پنج هزار ردیف در یک جدول بحرانی (و نسبتاً قابل پیش‌بینی) ناگهان به پانصد ردیف تبدیل می‌شود، بدون قافیه یا دلیل.

داشبورد شکسته باعث می‌شود که داشبورد اجرایی مقادیر تهی را باز کند.

یک تغییر طرح واره پنهان یک خط لوله پایین دستی را می‌شکند.

و لیست ادامه دارد.

کتاب Data Quality Fundamentals برای همه کسانی است که از داده‌های غیر قابل اعتماد، بی صدا یا با فریادهای خفه شده رنج برده‌اند و می‌خواهند کاری در مورد آن انجام دهند. ما انتظار داریم که این افراد از مهندسین داده، تجزیه و تحلیل داده یا پیشینه علم داده باشند و به طور فعال در ساخت، مقیاس‌بندی و مدیریت خطوط لوله داده شرکت خود مشارکت داشته باشند.

در ظاهر، ممکن است به نظر برسد که Data Quality Fundamentals کتابچه راهنمای نحوه تمیز کردن، جدل کردن، و به طور کلی درک داده‌ها است – و اینطور است. اما علاوه بر این، کتاب Data Quality Fundamentals به بهترین شیوه‌ها، فناوری‌ها و فرآیندهای مربوط به ایجاد سیستم‌های داده قابل اعتمادتر و در این فرآیند، پرورش اعتماد داده‌ها با تیم و سهامداران می‌پردازد.

در فصل 1، در مورد اینکه چرا کیفیت داده‌ها اکنون مستحق توجه است و اینکه چگونه روندهای معماری و فناوری به کاهش کلی حاکمیت و قابلیت اطمینان کمک می‌کنند، بحث خواهیم کرد. ما مفهوم “Data Downtime” را معرفی می‌کنیم و توضیح می‌دهیم که چگونه به روزهای اولیه تیم‌های مهندسی قابلیت اطمینان سایت (SRE) بازمی‌گردد و چگونه همین اصول DevOps می‌توانند در جریان‌های کاری مهندسی داده شما نیز اعمال شوند.

در فصل 2، نحوه ایجاد سیستم‌های داده انعطاف‌پذیرتر را با بررسی نحوه حل و اندازه‌گیری کیفیت داده در چندین فناوری خط لوله داده کلیدی، از جمله انبارهای داده، دریاچه‌های داده، و کاتالوگ داده، برجسته خواهیم کرد. این سه فناوری پایه، پیش‌تولید سلامت داده‌ها را ذخیره، پردازش و ردیابی می‌کنند، که طبیعتاً ما را به فصل 3 هدایت می‌کند، جایی که نحوه جمع‌آوری، تمیز کردن، تبدیل، و آزمایش داده‌های شما را با در نظر گرفتن کیفیت و قابلیت اطمینان توضیح خواهیم داد.

فصل 3 کتاب Data Quality Fundamentals

در مرحله بعد، فصل 4 یکی از مهم‌ترین جنبه‌های گردش کار قابلیت اطمینان داده‌ها – تشخیص و نظارت پیشگیرانه ناهنجاری – را با به اشتراک گذاشتن نحوه ساخت یک مانیتور کیفیت داده با استفاده از مجموعه داده‌های در دسترس عموم درباره سیارات فراخورشیدی بررسی می‌کند. این آموزش به خوانندگان این فرصت را می‌دهد تا مستقیماً درس‌هایی را که در مبانی کیفیت داده‌ها آموخته‌اند، در کار خود در این زمینه، هرچند در مقیاس محدود، به کار ببرند.

فصل 5 کتاب Data Quality Fundamentals به خوانندگان دیدی چشم‌بین از آنچه که برای کنار هم قرار دادن این فناوری‌های حیاتی نیاز است و سیستم‌ها و فرآیندهای قوی معمار می‌کند که تضمین می‌کند کیفیت داده‌ها بدون توجه به موارد استفاده اندازه‌گیری و حفظ می‌شود، ارائه می‌کند. همچنین به اشتراک می‌گذاریم که چگونه تیم‌های داده در کلاس Airbnb، Uber، Intuit و سایر شرکت‌ها قابلیت اطمینان داده‌ها را در جریان کاری روزانه خود ادغام می‌کنند، از جمله تنظیم SLA، SLI، و SLO، و ساخت پلت‌فرم‌های داده که بهینه‌سازی می‌کنند. برای کیفیت داده در پنج رکن کلیدی: تازگی، حجم، توزیع، طرحواره و اصل و نسب.

در فصل 6 کتاب Data Quality Fundamentals، مراحل لازم برای واکنش واقعی و رفع مشکلات کیفیت داده‌ها در محیط‌های تولید، از جمله مدیریت حوادث داده‌ها، تجزیه و تحلیل علت ریشه‌ای، پس از مرگ، و ایجاد بهترین شیوه‌های ارتباط حادثه را بررسی می‌کنیم. سپس، در فصل 7، خوانندگان درک خود را از تجزیه و تحلیل علت ریشه یک گام فراتر می‌برند و یاد می‌گیرند که چگونه با استفاده از ابزارهای متن‌باز محبوب و پرکاربردی که باید در زرادخانه هر مهندس داده وجود داشته باشند، تبار در سطح میدان ایجاد کنند.

فصل 6 کتاب Data Quality Fundamentals

در فصل 8 کتاب Data Quality Fundamentals، برخی از موانع فرهنگی و سازمانی را که تیم‌های داده هنگام تبلیغ و دموکراتیزه کردن کیفیت داده در مقیاس باید از آن عبور کنند، از جمله بهترین اصول در کلاس مانند رفتار با داده‌های شما مانند یک محصول، درک ماتریس RACI شرکت شما برای داده‌ها، بحث خواهیم کرد. کیفیت، و نحوه ساختار تیم داده خود برای حداکثر تأثیر تجاری.

در فصل ۹ کتاب Data Quality Fundamentals، چندین مطالعه موردی و مکالمه در دنیای واقعی را با ذهن‌های پیشرو در فضای مهندسی داده به اشتراک می‌گذاریم، از جمله ژامک دهقانی، خالق شبکه داده، آنتونیو فیتاس، که تیمش شجاعانه داستان خود را از نحوه مهاجرت به اشتراک می‌گذارد. به سمت معماری داده غیرمتمرکز (و ابتدا کیفیت داده!) و الکس توردوهلب، معاون خدمات داده در فاکس و پیشگام تکنیک مدیریت داده “آزادی کنترل شده”. این تکه تکه‌ای از تئوری و مثال‌های روی زمین به شما کمک می‌کند تصور کنید که چگونه چندین مفهوم کیفیت داده‌های فنی و فرآیند محور که در فصل‌های 1 تا 8 برجسته می‌کنیم، می‌توانند با رنگ‌های خیره‌کننده زنده شوند.

و در نهایت، در فصل 10 کتاب Data Quality Fundamentals، ما کتاب خود را با یک محاسبه ملموس برای اندازه‌گیری تأثیر مالی داده‌های ضعیف بر کسب‌وکارتان، در ساعات انسانی، به پایان می‌رسانیم تا به خوانندگان (که بسیاری از آنها وظیفه رفع خرابی داده‌ها را بر عهده دارند) کمک کنیم. با رهبری برای حل این مشکلات بر روی ابزارها و فرآیندهای بیشتری سرمایه گذاری کند. ما همچنین چهار مورد از پیش‌بینی‌های خود را برای آینده کیفیت داده برجسته خواهیم کرد زیرا به روندهای صنعت گسترده‌تر مربوط می‌شود، مانند مدیریت داده‌های توزیع‌شده و ظهور دریاچه داده‌ها.

فصل 10 کتاب Data Quality Fundamentals

حداقل، ما امیدواریم که در مورد اولویت بندی کیفیت داده‌ها و قابلیت اطمینان در سراسر سازمان خود، با چند ترفند از این کتاب دور شوید. همانطور که هر رهبر باتجربه داده ای به شما خواهد گفت، اعتماد به داده‌ها هرگز در یک روز ایجاد نمی‌شود، اما با رویکرد صحیح، می‌توان پیشرفت تدریجی را انجام داد – خط لوله به خط لوله.

سرفصل‌های کتاب Data Quality Fundamentals:

  • Preface
  • 1. Why Data Quality Deserves Attention—Now
  • 2. Assembling the Building Blocks of a Reliable Data System
  • 3. Collecting, Cleaning, Transforming, and Testing Data
  • 4. Monitoring and Anomaly Detection for Your Data Pipelines
  • 5. Architecting for Data Reliability
  • 6. Fixing Data Quality Issues at Scale
  • 7. Building End-to-End Lineage
  • 8. Democratizing Data Quality
  • 9. Data Quality in the Real World: Conversations and Case Studies
  • 10. Pioneering the Future of Reliable Data Systems
  • Index

جهت دانلود کتاب Data Quality Fundamentals می‌توانید پس از پرداخت، دریافت کنید.

توضیحات تکمیلی

فرمت کتاب

epub

ویرایش

First

ISBN

978-1-492-09628-3

تعداد صفحات

308

انتشارات

O'Reilly, O'Reilly Media

سال انتشار

حجم

نویسنده

, ,

هیچ دیدگاهی برای این محصول نوشته نشده است.

اشتراک‌گذاری:

دیگر محصولات:

نماد اعتبار ما:

آدرس: اصفهان، فلکه ارتش

 

پشتیبانی از ساعت 18 تا 22: 09392868101

© کليه حقوق محصولات و محتوای اين سایت متعلق به مدیر سایت می‌باشد و هر گونه کپی‌برداری از محتوا و محصولات سایت پیگرد قانونی دارد.