کتاب Hands-On Entity Resolution: A Practical Guide to Data Matching With Python (راهنمای کاربردی به حل موجودیت: یک راهنمای عملی برای تطبیق داده ها با استفاده از پایتون) یک تکنیک تحلیلی کلیدی است که به شما امکان میدهد چندین رکورد داده را شناسایی کنید که به یک موجودیت واقعی اشاره میکنند. با این راهنمای عملی، مدیران محصول، تحلیلگران داده و دانشمندان داده یاد میگیرند که چگونه با پاکسازی، تجزیه و تحلیل و حل مجموعه دادهها با استفاده از کتابخانههای Python منبع باز و APIهای ابری، به دادهها ارزش بیافزایند.
در ادامه مقدمهای از کتاب Hands-On Entity Resolution را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Hands-On Entity Resolution:
همه ما میخواهیم تصمیمات بهتری بگیریم. خواه برای ارائه خدمات بهتر به مشتریانمان یا حفظ امنیت آنها باشد، ما میخواهیم قضاوت درستی داشته باشیم و کار درست را انجام دهیم. برای اینکه با اطمینان عمل کنیم، باید بدانیم که به چه کسانی خدمت میکنیم و جایگاه آنها در جهان چیست. در حالی که اغلب بهمنی از دادهها در دسترس ما است، اغلب آنها به هم متصل نمیشوند و داستان کامل فردی را که پیش از ماست به ما نمیگوید.
وضوح موجودیت هنر و علم اتصال دادهها، پیوستن نقاط و دیدن تصویر کامل است. این کتاب یک راهنمای عملی است که به شما کمک میکند آن زمینه وسیعتر را آشکار کنید و به شما کمک میکند قبل از اقدام به طور کامل آگاه شوید. اغلب بدیهی تلقی میشود، اما در کتاب Hands-On Entity Resolution خواهید دید که تطبیق دادهها همیشه ساده نیست – اما نگران نباشید، تا فصل آخر به خوبی مجهز خواهید شد تا بر این چالشها غلبه کنید و مجموعه دادههای خود را زنده کنید.
چه کسی باید کتاب Hands-On Entity Resolution را بخواند؟
اگر مدیر محصول، تحلیلگر داده، یا دانشمند داده در خدمات مالی، داروسازی یا شرکت بزرگ دیگری هستید، این کتاب برای شما مناسب است. اگر با چالشهای دادههای سیلو شده که به یکدیگر متصل نمیشوند، دیدگاههای رقابتی از مشتریان خود در پایگاههای داده مختلف دارید، یا مسئول ادغام اطلاعات از سازمانها یا شرکتهای مختلف هستید، دست و پنجه نرم میکنید، این کتاب برای شما مناسب است.
متخصصان مدیریت ریسک که وظیفه مبارزه با جرایم مالی و مدیریت شهرت و خطرات زنجیره تأمین را بر عهده دارند نیز از درک چالشهای تطبیق دادهها در این کتاب و تکنیکهای غلبه بر آنها سود خواهند برد.
بیشتر بخوانید: کتاب Make Your Data Speak
چرا کتاب Hands-On Entity Resolution را نوشتم؟
چالش حل و فصل موجودیت در اطراف ما وجود دارد – ممکن است از آن کلمات استفاده نکنیم اما هر روز این روند بارها و بارها تکرار میشود. چند هفته قبل از تکمیل این کتاب، همسرم از من خواست که به او کمک کنم تا لیستی از پرداختکنندگان را از صورت حساب بانکی مطالعه کند. آیا همه افرادی که در لیست بودند پول پرداخت کرده بودند؟ این وضوح موجودیت در عمل بود!
ایده کتاب Hands-On Entity Resolution از میل به توضیح اینکه چرا بررسی یک تطابق با لیستی از نامها آنطور که به نظر میرسد آسان نیست و به نمایش گذاشتن برخی از ابزارها و تکنیکهای شگفتانگیز که اکنون برای کمک به حل این مشکل در دسترس هستند، زاده شد. در مقیاس
منامیدوارم که با راهنمایی شما از طریق برخی از مثالهای واقعی، در تطبیق مجموعه دادههای خود اطمینان حاصل کنید تا بتوانید به مشتریان خود خدمت کرده و از آنها محافظت کنید.
من دوست دارم در مورد سفر شما و هر گونه بازخوردی در مورد خود کتاب بشنوم. لطفاً هر مشکلی را در مورد کدی که همراه این کتاب است در GitHub مطرح کنید، یا برای بحث در مورد حل موجودیت به طور کلی، لطفاً در لینکدین با من تماس بگیرید.
وضوح موجودیت یک هنر و همچنین یک علم است. هیچ راه حل تجویز شدهای وجود ندارد که برای همه مجموعه دادهها کار کند. شما باید تصمیم بگیرید که چگونه فرآیند خود را تنظیم کنید تا به نتایجی که میخواهید برسید. امیدوارم خوانندگان این کتاب بتوانند در یافتن راه حلهای بهینه به یکدیگر کمک کنند و از تجربیات مشترک بهرهمند شوند.
بیشتر بخوانید: کتاب Building Knowledge Graphs
پیمایش در کتاب Hands-On Entity Resolution
این کتاب بهعنوان یک راهنمای عملی در نظر گرفته شده است، بنابراین من شما را تشویق میکنم که در حین کار در هر فصل، کد را دنبال کنید. یک اصل کلیدی طراحی کتاب، نشان دادن چالشها و راه حلها با استفاده از دادههای منبع باز دنیای واقعی بود.
اگر دنبال میکنید، این چالشها را به همراه دارد، زیرا نتایج شما ممکن است کمی متفاوت باشد زیرا مجموعه داده منبع از تاریخ انتشار بهروزرسانی میشود. لطفاً صفحه GitHub را برای بهروزرسانیهای اخیر و دسترسی به کد همراه کتاب بررسی کنید.
- فصل ۱ مقدمهای اساسی برای حل و فصل موجودیت، چرایی نیاز به آن و مراحل منطقی در فرآیند ارائه میدهد.
- فصل ۲ اهمیت استانداردسازی و پاکسازی دادهها را قبل از تلاش برای تطبیق رکوردها با یکدیگر نشان میدهد.
- فصلهای ۳ تا ۶ نحوه مقایسه رکوردهای داده برای حل موجودیتها با استفاده از مقایسههای تقریبی و تکنیکهای تطبیق احتمالی را نشان میدهد.
- فصل ۷ فرآیند گروهبندی رکوردهایی را که یک موجودیت مشابه را در یک خوشه منحصر به فرد قابل شناسایی توصیف میکنند، توصیف میکند.
- فصلهای ۸ و ۹ چگونگی افزایش مقیاس فرآیند تفکیک موجودیت را با استفاده از خدمات رایانش ابری نشان میدهند.
- فصل ۱۰ نشان میدهد که چگونه میتوان سوابق را با حفظ حریم خصوصی بین صاحبان داده پیوند داد.
- در نهایت، فصل ۱۱ برخی از ملاحظات بیشتر را هنگام طراحی فرآیند حل و فصل موجودیت توصیف میکند و چندایده نهایی در مورد تحولات احتمالی آینده ارائه میدهد.
توصیه میکنم فصلهای ۲ تا ۹ کتاب Hands-On Entity Resolution را بهطور متوالی بخوانید، زیرا آنها بهطور تدریجی راهحلهای حل موجودیت را با استفاده از مجموعه دادههای مشکل مشترک میسازند.
کتاب Hands-On Entity Resolution درک پایهای از پایتون را فرض میکند. آموزشهای تعاملی در http://learnpython.org برای شروع در دسترس هستند، یا من Python را برای تجزیه و تحلیل داده توسط Wes McKinney (O’Reilly) توصیه میکنم. خوانندگان پیشرفتهتر از دانش Pandas, Spark و Google Cloud Platform بهره خواهند برد
سرفصلهای کتاب Hands-On Entity Resolution:
- Copyright
- Table of Contents
- Preface
- Chapter 1. Introduction to Entity Resolution
- Chapter 2. Data Standardization
- Chapter 3. Text Matching
- Chapter 4. Probabilistic Matching
- Chapter 5. Record Blocking
- Chapter 6. Company Matching
- Chapter 7. Clustering
- Chapter 8. Scaling Up on Google Cloud
- Chapter 9. Cloud Entity Resolution Services
- Chapter 10. Privacy-Preserving Record Linkage
- Chapter 11. Further Considerations
- Index
- About the Author
- Colophon
جهت دانلود کتاب Hands-On Entity Resolution میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.