کتاب Data Mining and Predictive Analytics for Business Decisions (داده کاوی و تجزیه و تحلیل پیشبینیکننده برای تصمیمات تجاری: رویکرد مطالعه موردی) از بهترین منابع کاربردی داده کاوی برای به استفاده در تحلیلهای تجاری و پیشبینی آنها است.
در ادامه مقدمهای از کتاب Data Mining and Predictive Analytics for Business Decisions را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Mining and Predictive Analytics for Business Decisions:
داده کاوی یک پیشرفت اخیر در زمینه تجزیه و تحلیل دادهها در 20 سال گذشته است. با بسیاری از پیشرفتهای اخیر در علم داده، ما اکنون ابزارها و تکنیکهای بیشتری را در اختیار تحلیلگران دادهایم تا اطلاعات را از مجموعههای داده استخراج کنند. هدف این کتاب کمک به تحلیلگران داده است تا از ابزارهای ساده ای مانند Excel برای تجزیه و تحلیل توصیفی برای پاسخ به سوالات پیچیده تر با استفاده از یادگیری ماشینی استفاده کنند.
داده کاوی یک فعالیت بسیار پیچیده و سازمان یافته با فرآیندی کاملاً تعریف شده است که در استاندارد CRISP-DM کدگذاری شده است. در این کتاب ما درک درستی از ابزارها و تکنیکها برای کمک به تحلیلگر دادهها، اما نه لزوماً یک تیم علم داده، ایجاد میکنیم. این کتاب قصد دارد به تحلیلگران دادههای فردی کمک کند تا درک و مهارتهای خود را برای پاسخ به سؤالات پیچیده تر بهبود بخشند.
بیشتر تمرینها از R و Python استفاده میکنند که رایجترین ابزار تحلیل امروزی هستند. اما به جای تمرکز بر روی الگوریتمهای کدگذاری با این ابزارها، همانطور که اغلب اتفاق میافتد، از رابطهای تعاملی برای این ابزارها برای انجام تحلیل استفاده میکنیم. به این ترتیب، ما میتوانیم به جای توسعه مهارتهای کدنویسی، روی تکنیک و تفسیر آن تمرکز کنیم. ما به رابطهای Jamovi و JASP برای برنامه R و رابط داده کاوی Orange3 برای پایتون متکی هستیم.
در صورت اقتضا، ما ابزارهای اضافی و آسان برای دستیابی و استفاده، مانند Voyant را برای تجزیه و تحلیل متن، که به عنوان منبع باز در دسترس هستند، معرفی میکنیم. تکنیکهای پوشش داده شده در این کتاب از آمار توصیفی اولیه، مانند خلاصه و جدول بندی، تا تکنیکهای پیش بینی پیچیده تر، مانند رگرسیون خطی و لجستیک، خوشه بندی، طبقهبندی، و تجزیه و تحلیل متن را شامل میشود.
ما فرآیند CRISP-DM را در تمام طول انجام میدهیم، اما فقط به عنوان یک راهنمای ساده برای مراحل مختلف بدون لزوماً اجرای تمام رویههای آن. ما قصد داریم روی دادهها تمرکز کنیم
تجزیه و تحلیل، نه لزوماً رویکردهای پیچیده تر علم داده. اگر میخواهید مهارتهای تحلیلی خود را بهبود ببخشید و دانش عملی در مورد برخی از رویکردهای یادگیری ماشین کسب کنید، این کتاب برای شما مناسب است. فرض کنید به دنبال یک درمان عمیق تر از بسیاری از تکنیکهای ارائه شده در اینجا هستید، مانند مبانی ریاضی آنها یا ملاحظات دقیق تر در استفاده از الگوریتمها. در این صورت، با مراجعه به متون پیشرفته تر به بهترین وجه خدمت خواهید کرد.
کتاب Data Mining and Predictive Analytics for Business Decisions به این منظور نیست که ریشه یا ویژگیهای هر روش را به طور کامل توضیح دهد. در عوض، در قلب کتاب مجموعهای از تمرینها و مطالعات موردی واقعی وجود دارد که هر تکنیک یا ابزاری را در موقعیتهای مختلف تجاری کار میکند. ارائه درک نظری و تبیینی ابزارها را به سایر نویسندگان و متون دیگر واگذار میکنیم.
سهم قابل توجهی از این کتاب یک پایگاه داده مدیریت شده از فایلهای دادههای کسب و کار است که باید تمرین زیادی برای کسب مهارت در هر یک از تکنیکهای ارائه شده ارائه دهد. تمرینها و موارد در هر فصل با توضیحات گام به گام ارائه شده است تا به شما در کسب مهارت در استفاده از آنها کمک کند.
فصل 1 کتاب Data Mining and Predictive Analytics for Business Decisions داده کاوی و تجزیه و تحلیل دادهها و کاربرد آنها در تصمیمگیریهای تجاری را معرفی میکند. چگونگی و چرایی استفاده از دادهکاوی و تجزیه و تحلیل در یک زمینه تجاری را پوشش میدهد، و اطلاعات نیاز به استفاده از ابزارهای پیشرفته تجزیه و تحلیل دادهها، و رسمی بودن فرآیند دادهکاوی دارد.
داده کاوی، یادگیری ماشین، تجزیه و تحلیل داده، تجزیه و تحلیل داده، علم تصمیم گیری و علم داده را در زمینه قرار میدهد. ما در فصل اول نقشهای تحلیلگران داده را معرفی کرده و آنها را از دانشمندان داده متمایز میکنیم. با افزایش توسعه علم داده، ما اکنون تکنیکها و ابزارهای قابل توجه زیادی برای گسترش تجزیه و تحلیل دادهها از یک خلاصه ساده از دادههای عددی یا دادههای طبقه بندی جدول بندی برای پاسخ به سؤالات پیچیده با مدلهای عددی داریم. ما بحث میکنیم که چه زمانی داده کاوی مناسب است و چه زمانی مناسب نیست.
در فصل 2 کتاب Data Mining and Predictive Analytics for Business Decisions، فرآیند داده کاوی را پوشش میدهیم و درک درستی از فرآیند CRISP-DM را معرفی و توسعه میدهیم.
ما نقش یادگیری ماشین را در فرآیند داده کاوی معرفی میکنیم و تفاوت بین داده کاوی و یادگیری ماشین را مورد بحث قرار میدهیم.
کشف دانش در پایگاههای داده (KDD)، یک ساختار موازی، و رابطه آن با DM معرفی شده است. مطالعات موردی در مورد کاربرد CRISP-DM در تجارت. ما در مورد زمینه و نیاز اطلاعاتی که داده کاوی را به پیش میبرد، بحث میکنیم و فصل بعدی را در مورد پرسشهای چارچوببندی به عنوان نقطه پایانی حیاتی برای این فعالیت تنظیم میکنیم.
فصل 3 کتاب Data Mining and Predictive Analytics for Business Decisions مفهوم نیاز کسب و کار و زمینه ای را که این نیازها را به وجود میآورد معرفی میکند. فصل 3 اولین بار سنگین برای تحلیلگر داده است: تبدیل درخواستهای اطلاعاتی مبهم ناشی از نیازهای اطلاعاتی مدیریت و همکاری به سؤالات تحلیلی واضح و خوششکل که به تکنیکهای تحلیلی تسلیم میشوند. این قلب تجزیه و تحلیل دادهها است: تولید سؤالات به خوبی شکل گرفته که ابزارهای تجزیه و تحلیل را ارائه میدهد. بقیه کار یافتن دادهها و استفاده از ابزارها است. قاب بندی سوالات نیاز به بینش و خلاقیت دارد.
هنگامی که سؤالات قاب شد، ما به دنبال دادههایی برای پاسخ به سؤالاتی هستیم که فصل 4 کتاب Data Mining and Predictive Analytics for Business Decisions به اکتساب و آمادهسازی میپردازد. لازم به ذکر است که اغلب ما دادههایی را داریم که در سیستمهای پردازش تراکنش آنلاین (OLTP) و در مخازن دادههای خلاصه شده مانند انبارهای داده (OLAP) جمعآوری میشوند، که دادههای مورد نیاز را با استفاده از پرس و جوهای SQL استخراج میکنیم.
ما اغلب از قبل مجموعه دادهها را در اختیار داریم، اما باید در مورد اینکه کدام بخش از دادهها را برای تجزیه و تحلیل خود برای پاسخ به سؤالات چارچوبی آماده کنیم، عاقلانه عمل کنیم. ما اغلب نیاز داریم که دادهها را بیشتر دستکاری کنیم تا آنها را برای استفاده از الگوریتمهای خود آماده کنیم.
فصل 5 کتاب Data Mining and Predictive Analytics for Business Decisions به شما نشان میدهد که چگونه دادهها را کاوش کنید و چه چیزی را آمار توصیفی مینامند. ما از ابزارهای خلاصهسازی و جدولبندی برای درک دادهها و هر متغیر استفاده میکنیم و به سؤالات توصیفی ساده پاسخ میدهیم: چند، چقدر، چه زمانی، میانگینها چقدر هستند و مقایسههای متقابل ساده را به دست میآوریم.
فصل 6 کتاب Data Mining and Predictive Analytics for Business Decisions مفهوم یک مدل را معرفی میکند و نشان میدهد که مدلهای داده چگونه ساخته میشوند. این گامهای متعدد در استفاده از الگوریتمها برای تبدیل عبارات ریاضی به ابزارهای ارزشمند برای پیشبینی را بررسی میکند. ما در اینجا پایه و اساس را برای بهره مندی از الگوریتمهای محاسباتی مختلف ارائه شده در هفت فصل بعدی میگذاریم.
ما بین ماشینها، یادگیری ماشین، ساخت مدل داده، یادگیری تحت نظارت و بدون نظارت، و آموزش و آزمایش مجموعه دادهها به عنوان مفاهیم اصلی مدلسازی تفاوت قائل میشویم. یک مدل به خوبی شکل گرفته بر اساس پاسخ به سؤالات با چارچوب مناسب، محصول فرآیند داده کاوی و مبنایی برای تصمیم گیری مداوم تجاری است.
با استفاده از استاندارد داده کاوی CRISP-DM، از فصول اولیه حاضر در انجام مراحل آماده سازی داده کاوی استفاده میکنیم: ترجمه نیازهای اطلاعات کسب و کار به پرسشهای تحلیلی چارچوب بندی شده و آماده سازی دادهها. فصل 1 کتاب Data Mining and Predictive Analytics for Business Decisions تمرین فراوانی در چارچوب بندی سؤالات تحلیلی اعمال شده در دادههای متنی ارائه میدهد. فصل 2 به طور خلاصه رایج ترین ابزارها برای تهیه داده و داده کاوی را پوشش میدهد.
فصل 3 کتاب Data Mining and Predictive Analytics for Business Decisions مکانهایی را که دادههای متنی ممکن است در پایگاههای اطلاعاتی کسب و کار و موقعیتها و اشکالی که ممکن است به خود بگیرد، بررسی میکند.
فصل 4 کتاب Data Mining and Predictive Analytics for Business Decisions آماده سازی دادهها و شکل دادن به مجموعه دادهها برای تجزیه و تحلیل را پوشش میدهد.
هفت فصل زیر رویکردهای تحلیلی اصلی داده کاوی را پوشش میدهد:
ابزارها. در فصل 7 کتاب Data Mining and Predictive Analytics for Business Decisions، الگوریتمهای پیشبینی را با استفاده از رگرسیون، رگرسیون خطی و رگرسیون لجستیک پوشش میدهیم.
ما طبقهبندی را در فصل 8 کتاب Data Mining and Predictive Analytics for Business Decisions با استفاده از درختهای تصمیم، جنگلهای تصادفی و الگوریتمهای Naïve Bays پوشش میدهیم. فصل 9 تکنیکهای بدون نظارت خوشه بندی، مانند خوشه بندی سلسله مراتبی و خوشه بندی k-means را پوشش میدهد. فصل 10 فصل 7 را در مورد رگرسیون گسترش میدهد تا روندها و پیش بینیهایی را برای دادههای سری زمانی ایجاد کند.
فصل 11 کتاب Data Mining and Predictive Analytics for Business Decisions تکنیک پیشرفته انتخاب ویژگی با استفاده از الگوریتمهای کاهش متغیر را معرفی میکند. ما آن را با موفقیت زیادی در موقعیتهای مختلف تجاری اعمال میکنیم. ما همچنین ابزارهایی را برای کشف ناهنجاریها در دادههای خود در فصل 12 ارائه میکنیم.
ما یک حالت پرت را به دو صورت تعریف میکنیم: رویکرد سه سیگما و حصارهای Tukey با استفاده از چارکها. در نهایت، ما در فصل 13 کتاب Data Mining and Predictive Analytics for Business Decisions به تجزیه و تحلیل دادههای متنی با تکنیکهای مختلف میپردازیم: تجزیه و تحلیل بسامد اصطلاح، تجزیه و تحلیل کلمات کلیدی، تجسم متن با استفاده از ابرهای کلمه، و امتیاز شباهت متن.
فصل 14 کتاب Data Mining and Predictive Analytics for Business Decisions مکمل فصل 6 است. ما مدل سازی را تعریف کردیم و مراحل ساخت مدل را در فصل 6 بررسی کردیم. اکنون در فصل 14، مدل سازی را با ارائه تکنیکهای اعتبارسنجی مدل، استفاده از قطار و مجموعه دادههای آزمایشی برای بررسی اضافه برازش به پایان میرسانیم. و نحوه تصحیح سردرگمی متغیرها با بررسی همخطی بودن.
فصل 15 با نمونهبرداری برای استخراج مجموعه کوچکتری از دادهها برای تجزیه و تحلیل اولیه یا استفاده از ابزارهایی (مانند اکسل) که به اندازه مجموعه دادهها محدود میشوند، به فایلهای کلان داده کمک میکند.
سرفصلهای کتاب Data Mining and Predictive Analytics for Business Decisions:
- Cover
- Title Page
- Copyright
- Dedication
- Contents
- Preface
- Acknowledgments
- Chapter 1: Data Mining and Business
- Chapter 2: The Data Mining Process
- Chapter 3: Framing Analytical Questions
- Chapter 4: Data Preparation
- Chapter 5: Descriptive Analysis
- Chapter 6: Modeling
- Chapter 7: Predictive Analytics with Regression Models
- Chapter 8: Classification
- Chapter 9: Clustering
- Chapter 10: Time Series Forecasting
- Chapter 11: Feature Selection
- Chapter 12: Anomaly Detection
- Chapter 13: Text Data Mining
- Chapter 14: Working with Large Data Sets
- Chapter 15: Visual Programming
- Index
جهت دانلود کتاب Data Mining and Predictive Analytics for Business Decisions میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.