کتاب The Data Science Handbook, 2nd Edition (دفترچه راهنمای علوم داده، ویرایش دوم) یک راهنمای عملی و در دسترس برای تبدیل شدن به یک دانشمند داده است که با آخرین پیشرفتها در علم داده و حوزههای مرتبط بهروز شده است.
کتاب The Data Science Handbook به شما کمک میکند تا تمام مهارتهای ضروری برای یک دانشمند داده را به دست آورید، از جمله برنامهنویسی، آمار، یادگیری ماشین و ابزارهای مختلف.
در ادامه مقدمهای از کتاب The Data Science Handbook را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب The Data Science Handbook:
پیشگفتار ویرایش دوم
در ویرایش اول کتاب The Data Science Handbook، مقدمه را “شدن یک تک شاخ” نامیدم. علم داده یک حوزه جدید بود که به خوبی درک نشده بود و دانشمندان داده اغلب به دلیل توانایی معجزهآسای خود در انجام هم ریاضیات و هم برنامهنویسی، “تک شاخ” نامیده میشدند.
من کتاب The Data Science Handbook را با یک پیام اصلی نوشتم: علم داده به اندازه آنچه مردم میگویند، غیرقابل دسترسی نیست. کسب تمام مهارتهای مورد نیاز برای هر کسی کاملاً منطقی است و هدف کتاب من این بود که یک منبع جامع برای یادگیری آنها باشد.
از آن زمان تاکنون تغییرات زیادی رخ داده است و خوشحالم که سیستم آموزشی نیز پیشرفت کرده است. اکنون برنامههای تحصیلی و بوتکمپهایی وجود دارند که میتوانند اصول اولیه علم داده را به تقریباً هر کسی که مایل به یادگیری آنها باشد، آموزش دهند.
برنامههای درسی نسبتاً استاندارد وجود دارد، افراد کمتری هستند که از این موضوع گیج شدهاند و متخصصان جوان بیشتری وارد این حرفه هیجانانگیز میشوند. علم داده از یک کشیش مبهم به یک حرفه هیجانانگیز تبدیل شده است که افراد عادی میتوانند داشته باشند.
با گسترش این رشته، ابزارها نیز تکامل یافتهاند و احساس کردم که ویرایش دوم ضروری است. مهمترین تغییری که ایجاد کردهام، پوشش بیشتر یادگیری عمیق است: قبلاً من تقریباً به RNNها اشاره نکردم، اما اکنون به موضوعاتی مانند معماریهای رمزگذار-رمزگشا، مدلهای انتشار، LLMها و مهندسی پرامت ادامه میدهم.
ابزارهای هوش مصنوعی به بلوغ رسیدهاند (شاید هوش مصنوعی اکنون جایی است که علم داده 10 سال پیش بود) و یک دانشمند داده باید با آنها آشنا باشد. همچنین، پوشش Spark را برای پوشش رابط DataFrame جدید آن بهروز کردهام و تأکید بر Hadoop را کاهش دادهام زیرا در حال افول است.
تغییرات دیگر شامل کاهش تأکید بر شبکههای بیزی (که با ظهور یادگیری عمیق محبوبیت کمتری پیدا کردهاند)، تغییر از پایتون 2 به پایتون 3 و بهبودهای متعدد در نثر است.
کتاب The Data Science Handbook به سه بخش اصلی تقسیم شده است:
بخش اول: مباحث ضروری این بخش شامل مباحثی است که به تجربه من، در تقریباً هر پروژه دادهکاوی مورد استفاده قرار میگیرند.
این مهارتهای پایه، برای هر سطحی از دادهکاوی کاملاً ضروری هستند. بخش اول کتاب The Data Science Handbook همچنین برای افرادی نوشته شده است که به دادهکاوی نیاز دارند تا به یک سوال خاص پاسخ دهند، اما قصد ندارند دانشمند داده تمامعیار شوند. اگر شما در این دسته قرار دارید، احتمالاً بخش اول کتاب همه چیزهایی را که نیاز دارید، به شما میدهد.
بخش دوم: مباحث مهم این بخش شامل مهارتهای اصلی اضافی برای یک دانشمند داده است. برخی از این مهارتها، مانند خوشهبندی، بسیار رایج هستند که تقریباً میتوانستند در بخش اول قرار بگیرند و میتوانند به راحتی در هر پروژهای نقش داشته باشند.
برخی دیگر، مانند پردازش زبان طبیعی (NLP)، موضوعات تخصصی هستند که در برخی حوزهها حیاتی هستند اما در برخی دیگر اضافی هستند. به نظر من، یک دانشمند داده باید در همه این موضوعات آگاه باشد، حتی اگر همیشه از همه آنها استفاده نکند.
بخش سوم: مباحث تکمیلی بخش نهایی، مباحث مختلفی را پوشش میدهد که اختیاری هستند. برخی از این فصلها فقط گسترش موضوعات بخشهای اول و دوم هستند، اما پیشزمینه نظری بیشتری ارائه میدهند و برخی موضوعات اضافی را مورد بحث قرار میدهند.
برخی دیگر کاملاً مطالب جدیدی هستند که در دادهکاوی مطرح میشوند، اما ممکن است در طول یک حرفه بدون اینکه هرگز با آنها برخورد کنید، پیش بروید.
چگونه از کتاب The Data Science Handbook استفاده کنیم؟ این کتاب با سه هدف نوشته شده است:
- مطالعه کامل: میتوانید آن را از ابتدا تا انتها بخوانید. اگر این کار را انجام دهید، باید یک دوره خودآموز در زمینه دادهکاوی را به شما ارائه دهد که شما را برای مقابله با مشکلات واقعی آماده میکند. اگر پیشزمینه قوی در برنامهنویسی کامپیوتر یا ریاضیات دارید، برخی از آن برای شما مرور خواهد بود.
- یادگیری موضوعات خاص: میتوانید از آن برای به سرعت به روز شدن در یک موضوع خاص استفاده کنید. من سعی کردهام فصلهای مختلف، به ویژه فصلهای پس از بخش اول، نسبتاً مستقل باشند.
- یادگیری عملی: کتاب حاوی بسیاری از کدهای نمونه است که به اندازه کافی بزرگ هستند تا به عنوان نقطه شروع برای پروژههای خود استفاده کنید.
سرفصلهای کتاب The Data Science Handbook:
- Cover
- Table of Contents
- Title Page
- Copyright Page
- Dedication Page
- Preface to the First Edition
- Preface to the Second Edition
- 1 Introduction
- Part 1: The Stuff You’ll Always Use
- 2 The Data Science Road Map
- 3 Programming Languages
- Interlude: My Personal Toolkit
- 4 Data Munging: String Manipulation, Regular Expressions, and Data Cleaning
- 5 Visualizations and Simple Metrics
- 6 Overview: Machine Learning and Artificial Intelligence
- 7 Interlude: Feature Extraction Ideas
- 8 Machine-Learning Classification
- 9 Technical Communication and Documentation
- Part II: Stuff You Still Need to Know
- 10 Unsupervised Learning: Clustering and Dimensionality Reduction
- 11 Regression
- 12 Data Encodings and File Formats
- 13 Big Data
- 14 Databases
- 15 Software Engineering Best Practices
- 16 Traditional Natural Language Processing
- 17 Time Series Analysis
- 18 Probability
- 19 Statistics
- 20 Programming Language Concepts
- 21 Performance and Computer Memory
- Part III: Specialized or Advanced Topics
- 22 Computer Memory and Data Structures
- 23 Maximum-Likelihood Estimation and Optimization
- 24 Deep Learning and AI
- 25 Stochastic Modeling
- 26 Parting Words
- Index
- End User License Agreement
جهت دانلود کتاب The Data Science Handbook میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.