کتاب Data Mining and Exploration (دادهکاوی و اکتشاف: از آمار سنتی تا علم داده مدرن) از جدیدترین کتابهای مربوط به دادهکاوی میباشد که در سال 2022 به چاپ رسیده است. این کتاب در 11 فصل به آموزش این علم از پایه تا بیان نکات مهم و پیشرفته خواهد پرداخت.
در ادامه مقدمهای از کتاب Data Mining and Exploration را شرح خواهیم داد.
مقدمهای بر کتاب Data Mining and Exploration:
این کتاب جنبههای مفهومی و رویهای روشهای پیشرفته علم داده، مانند تجسم دادههای پویا، شبکههای عصبی مصنوعی، روشهای مجموعه، و متن کاوی را معرفی میکند. حداقل دو عنصر منحصر به فرد وجود دارد که میتواند کتاب را از رقبای خود متمایز کند.
اولاً، اکثر دانشجویان علوم اجتماعی، مهندسی و بازرگانی حداقل یک کلاس آمار مقدماتی را قبل از یادگیری علم داده شرکت کردند. با این حال، معمولاً این دورهها شباهتها و تفاوتهای بین آمار سنتی و علم داده مدرن را مورد بحث قرار نمیدهند. در نتیجه یادگیرندگان با این تغییر پارادایم به ظاهر شدید سرگردان میشوند.
در واکنش، برخی از سنتگرایان به طور کلی علم داده را رد میکنند در حالی که برخی از تحلیلگران مبتدی از ابزارهای داده کاوی به عنوان “جعبه سیاه” استفاده میکنند،
بدون اینکه دیدگاه جامعی از تفاوتهای اساسی بین روشهای سنتی و مدرن داشته باشند (مانند تفکر دوگانه در مقابل تشخیص الگو، تایید در مقابل اکتشاف، روش منفرد در مقابل مثلثبندی، نمونه تک در مقابل اعتبارسنجی متقاطع و غیره). این کتاب انتقال بین روشهای کلاسیک و علم داده را ترسیم میکند (به عنوان مثال از مقدار p به ارزش ورود، از نمونهبرداری مجدد به روشهای مجموعه، از تحلیل محتوا به متنکاوی و غیره). دوم، هدف کتاب Data Mining and Exploration گسترش افق یادگیرنده با پوشش مجموعهای از ابزارهای نرمافزاری است.
وقتی یک تکنسین چکش دارد، به نظر میرسد هر مشکلی یک میخ است. به همین ترتیب، بسیاری از کتابهای درسی تنها بر روی یک بسته نرمافزاری متمرکز میشوند و در نتیجه، زبانآموز تمایل دارد که مشکل را با ابزار تطبیق دهد، اما نه برعکس. برای اصلاح وضعیت، یک تحلیلگر توانمند باید به جای یک ابزار واحد، به یک مجموعه ابزار مجهز باشد.
به عنوان مثال، هنگامی که تحلیلگر با دادههای مهم در یک صنعت بسیار تنظیم شده، مانند داروسازی و بانکداری کار میکند، ماژولهای نرمافزار تجاری (به عنوان مثال، SAS) ضروری هستند. برای یک شرکت متوسط و کوچک، بستههای منبع باز مانند پایتون مفید خواهند بود.
اگر هدف تحقیق ایجاد یک خلاصه اجرایی سریع باشد، انتخاب منطقی مقایسه سریع مدل است. اگر تحلیلگر میخواهد دادهها را با پرسیدن سؤالات «چه میشود» بررسی کند، نمودار پویا در JMP Pro گزینه بهتری است. این کتاب از مثالهای عینی برای توضیح مزایا و معایب نرمافزارهای مختلف استفاده میکند.
سرفصلهای کتاب Data Mining and Exploration:
- Cover
- Half Title
- Title Page
- Dedication
- Preface
- Table of Contents
- Chapter 1: Re-examination of Traditional Statistics
- Chapter 2: Why Data Science?
- Chapter 3: Cutting Edge Data Analytical Tools
- Chapter 4: Exploratory Data Analysis and Data Visualization: Pattern Seeking
- Chapter 5: Generalized Regression: Penalty against Complexity
- Chapter 6: Classification and Model Screening
- Chapter 7: Ensemble Methods: The Wisdom of the Crowd
- Chapter 8: Dimension Reduction: Breaking the Curse of Dimensionality
- Chapter 9: Clustering: Divide and Conquer
- Chapter 10: Neural Networks: Machines Mimic Human Intelligence
- Chapter 11: Text Mining: Structure the Unstructured
- Index
فایل کتاب Data Mining and Exploration را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.