کتاب Data Quality Fundamentals (مبانی کیفیت داده: راهنمای پیشرفته برای ایجاد خطوط لوله داده قابل اعتماد) از جدیدترین کتابهای حوزهی علوم داده است که در سال 2022 به چاپ رسیده است. این کتاب در 10 فصل به آموزش گامبهگام داده و کیفیت آن خواهد پرداخت.
در ادامه مقدمهای از کتاب Data Quality Fundamentals را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Quality Fundamentals:
اگر هر یک از سناریوهای زیر را تجربه کردهاید، دست خود را بالا بیاورید (یا، فقط میتوانید به نشانه همبستگی سری تکان دهید – هیچ راهی وجود ندارد که در غیر این صورت متوجه شویم):
پنج هزار ردیف در یک جدول بحرانی (و نسبتاً قابل پیشبینی) ناگهان به پانصد ردیف تبدیل میشود، بدون قافیه یا دلیل.
داشبورد شکسته باعث میشود که داشبورد اجرایی مقادیر تهی را باز کند.
یک تغییر طرح واره پنهان یک خط لوله پایین دستی را میشکند.
و لیست ادامه دارد.
کتاب Data Quality Fundamentals برای همه کسانی است که از دادههای غیر قابل اعتماد، بی صدا یا با فریادهای خفه شده رنج بردهاند و میخواهند کاری در مورد آن انجام دهند. ما انتظار داریم که این افراد از مهندسین داده، تجزیه و تحلیل داده یا پیشینه علم داده باشند و به طور فعال در ساخت، مقیاسبندی و مدیریت خطوط لوله داده شرکت خود مشارکت داشته باشند.
در ظاهر، ممکن است به نظر برسد که Data Quality Fundamentals کتابچه راهنمای نحوه تمیز کردن، جدل کردن، و به طور کلی درک دادهها است – و اینطور است. اما علاوه بر این، کتاب Data Quality Fundamentals به بهترین شیوهها، فناوریها و فرآیندهای مربوط به ایجاد سیستمهای داده قابل اعتمادتر و در این فرآیند، پرورش اعتماد دادهها با تیم و سهامداران میپردازد.
در فصل 1، در مورد اینکه چرا کیفیت دادهها اکنون مستحق توجه است و اینکه چگونه روندهای معماری و فناوری به کاهش کلی حاکمیت و قابلیت اطمینان کمک میکنند، بحث خواهیم کرد. ما مفهوم “Data Downtime” را معرفی میکنیم و توضیح میدهیم که چگونه به روزهای اولیه تیمهای مهندسی قابلیت اطمینان سایت (SRE) بازمیگردد و چگونه همین اصول DevOps میتوانند در جریانهای کاری مهندسی داده شما نیز اعمال شوند.
در فصل 2، نحوه ایجاد سیستمهای داده انعطافپذیرتر را با بررسی نحوه حل و اندازهگیری کیفیت داده در چندین فناوری خط لوله داده کلیدی، از جمله انبارهای داده، دریاچههای داده، و کاتالوگ داده، برجسته خواهیم کرد. این سه فناوری پایه، پیشتولید سلامت دادهها را ذخیره، پردازش و ردیابی میکنند، که طبیعتاً ما را به فصل 3 هدایت میکند، جایی که نحوه جمعآوری، تمیز کردن، تبدیل، و آزمایش دادههای شما را با در نظر گرفتن کیفیت و قابلیت اطمینان توضیح خواهیم داد.
در مرحله بعد، فصل 4 یکی از مهمترین جنبههای گردش کار قابلیت اطمینان دادهها – تشخیص و نظارت پیشگیرانه ناهنجاری – را با به اشتراک گذاشتن نحوه ساخت یک مانیتور کیفیت داده با استفاده از مجموعه دادههای در دسترس عموم درباره سیارات فراخورشیدی بررسی میکند. این آموزش به خوانندگان این فرصت را میدهد تا مستقیماً درسهایی را که در مبانی کیفیت دادهها آموختهاند، در کار خود در این زمینه، هرچند در مقیاس محدود، به کار ببرند.
فصل 5 کتاب Data Quality Fundamentals به خوانندگان دیدی چشمبین از آنچه که برای کنار هم قرار دادن این فناوریهای حیاتی نیاز است و سیستمها و فرآیندهای قوی معمار میکند که تضمین میکند کیفیت دادهها بدون توجه به موارد استفاده اندازهگیری و حفظ میشود، ارائه میکند. همچنین به اشتراک میگذاریم که چگونه تیمهای داده در کلاس Airbnb، Uber، Intuit و سایر شرکتها قابلیت اطمینان دادهها را در جریان کاری روزانه خود ادغام میکنند، از جمله تنظیم SLA، SLI، و SLO، و ساخت پلتفرمهای داده که بهینهسازی میکنند. برای کیفیت داده در پنج رکن کلیدی: تازگی، حجم، توزیع، طرحواره و اصل و نسب.
در فصل 6 کتاب Data Quality Fundamentals، مراحل لازم برای واکنش واقعی و رفع مشکلات کیفیت دادهها در محیطهای تولید، از جمله مدیریت حوادث دادهها، تجزیه و تحلیل علت ریشهای، پس از مرگ، و ایجاد بهترین شیوههای ارتباط حادثه را بررسی میکنیم. سپس، در فصل 7، خوانندگان درک خود را از تجزیه و تحلیل علت ریشه یک گام فراتر میبرند و یاد میگیرند که چگونه با استفاده از ابزارهای متنباز محبوب و پرکاربردی که باید در زرادخانه هر مهندس داده وجود داشته باشند، تبار در سطح میدان ایجاد کنند.
در فصل 8 کتاب Data Quality Fundamentals، برخی از موانع فرهنگی و سازمانی را که تیمهای داده هنگام تبلیغ و دموکراتیزه کردن کیفیت داده در مقیاس باید از آن عبور کنند، از جمله بهترین اصول در کلاس مانند رفتار با دادههای شما مانند یک محصول، درک ماتریس RACI شرکت شما برای دادهها، بحث خواهیم کرد. کیفیت، و نحوه ساختار تیم داده خود برای حداکثر تأثیر تجاری.
در فصل ۹ کتاب Data Quality Fundamentals، چندین مطالعه موردی و مکالمه در دنیای واقعی را با ذهنهای پیشرو در فضای مهندسی داده به اشتراک میگذاریم، از جمله ژامک دهقانی، خالق شبکه داده، آنتونیو فیتاس، که تیمش شجاعانه داستان خود را از نحوه مهاجرت به اشتراک میگذارد. به سمت معماری داده غیرمتمرکز (و ابتدا کیفیت داده!) و الکس توردوهلب، معاون خدمات داده در فاکس و پیشگام تکنیک مدیریت داده “آزادی کنترل شده”. این تکه تکهای از تئوری و مثالهای روی زمین به شما کمک میکند تصور کنید که چگونه چندین مفهوم کیفیت دادههای فنی و فرآیند محور که در فصلهای 1 تا 8 برجسته میکنیم، میتوانند با رنگهای خیرهکننده زنده شوند.
و در نهایت، در فصل 10 کتاب Data Quality Fundamentals، ما کتاب خود را با یک محاسبه ملموس برای اندازهگیری تأثیر مالی دادههای ضعیف بر کسبوکارتان، در ساعات انسانی، به پایان میرسانیم تا به خوانندگان (که بسیاری از آنها وظیفه رفع خرابی دادهها را بر عهده دارند) کمک کنیم. با رهبری برای حل این مشکلات بر روی ابزارها و فرآیندهای بیشتری سرمایه گذاری کند. ما همچنین چهار مورد از پیشبینیهای خود را برای آینده کیفیت داده برجسته خواهیم کرد زیرا به روندهای صنعت گستردهتر مربوط میشود، مانند مدیریت دادههای توزیعشده و ظهور دریاچه دادهها.
حداقل، ما امیدواریم که در مورد اولویت بندی کیفیت دادهها و قابلیت اطمینان در سراسر سازمان خود، با چند ترفند از این کتاب دور شوید. همانطور که هر رهبر باتجربه داده ای به شما خواهد گفت، اعتماد به دادهها هرگز در یک روز ایجاد نمیشود، اما با رویکرد صحیح، میتوان پیشرفت تدریجی را انجام داد – خط لوله به خط لوله.
سرفصلهای کتاب Data Quality Fundamentals:
- Preface
- 1. Why Data Quality Deserves Attention—Now
- 2. Assembling the Building Blocks of a Reliable Data System
- 3. Collecting, Cleaning, Transforming, and Testing Data
- 4. Monitoring and Anomaly Detection for Your Data Pipelines
- 5. Architecting for Data Reliability
- 6. Fixing Data Quality Issues at Scale
- 7. Building End-to-End Lineage
- 8. Democratizing Data Quality
- 9. Data Quality in the Real World: Conversations and Case Studies
- 10. Pioneering the Future of Reliable Data Systems
- Index
جهت دانلود کتاب Data Quality Fundamentals میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.