کتاب Data Mining for Business Analytics یکی از بهترین و قویترین کتابهای آموزش داده کاوی به همراه مثالهای عملی و کاربردی در زبان برنامهنویسی پایتون است. در این کتاب به شرح قواعد دادهکاوی مانند: تجسم دادهها، رگرسیون خطی چندگانه، روشهای متداول در دادهکاوی مانند KNN برای پیدا کردن نزدیکترین همسایه، طبقه بندی و رگرسیون درختان، آنالیز خوشهای، پیش بینی مبتنی بر رگرسیون و چندین روش مهم در علم دادهکاوی میپردازد. کتاب Data Mining for Business Analytics علاوه بر آن با شرح هر فصل، مثالهایی با زبان برنامهنویسی پایتون برای پیادهسازی عملی هر کدام از روشها بیان خواهد شد.
نگاهی گذرا به داده کاوی:
داده کاوی به بهرهگیری از ابزارهای تجزیه و تحلیل دادهها به منظور کشف الگوها و روابط معتبری که تاکنون ناشناخته بودهاند اطلاق میشود. این ابزارها ممکن است مدلهای آماری، الگوریتمهای ریاضی و روشهای یاد گیرنده (Machine Learning Methods) باشند که کار این خود را به صورت خودکار و بر اساس تجربهای که از طریق شبکههای عصبی (Neural Networks) یا درختهای تصمیمگیری (Decision Trees) به دست میآورند بهبود میبخشد.
داده کاوی منحصر به گردآوری و مدیریت دادهها نبوده و تجزیه و تحلیل اطلاعات و پیشبینی را نیز شامل میشود برنامههای کاربردی که با بررسی فایلهای متن یا چند رسانهای به کاوش دادهها میپردازند پارامترهای گوناگونی را در نظر میگیرد که عبارت اند از:
- قواعد انجمنی (Association): الگوهایی که بر اساس آن یک رویداد به دیگری مربوط میشود مثلاً خرید قلم به خرید کاغذ.
- ترتیب (Sequence): الگویی که به تجزیه و تحلیل توالی رویدادها پرداخته و مشخص میکند کدام رویداد، رویدادهای دیگری را در پی دارد مثلاً تولد یک نوزاد و خرید پوشک.
- پیشبینی(Prediction): در پیشبینی هدف پیشبینی یک متغیر پیوسته میباشد. مانند پیشبینی نرخ ارز یا هزینههای درمانی.
- ردهبندی یا طبقهبندی (Classification): فرایندی برای پیدا کردن مدلی است که ردههای موجود در دادهها را تعریف مینماید و متمایز میکند، با این هدف که بتوان از این مدل برای پیشبینی رده رکوردهایی که برچسب رده آنها (متغیر هدف) ناشناخته میباشد، استفاده نمود. در حقیقت در ردهبندی بر خلاف پیشبینی، هدف پیشبینی مقدار یک متغیر گسستهاست. روشهای مورد استفاده در پیشبینی و ردهبندی عموماً یکسان هستند.
- خوشهبندی (Clustering): گروهبندی مجموعهای از اعضاء، رکوردها یا اشیاء به نحوی که اعضای موجود در یک خوشه بیشترین شباهت را به یکدیگر و کمترین شباهت را به اعضای خوشههای دیگر داشته باشند.
- مصورسازی (visualization): مصورسازی دادهها یکی از قدرتمندترین و جذابترین روشهای اکتشاف در دادهها میباشد.
سرفصلهای کتاب Data Mining for Business Analytics:
- Introduction
- Overview of the Data Mining Process
- Data Visualization
- Dimension Reduction
- Evaluating Predictive Performance
- Multiple Linear Regression
- k-Nearest Neighbors (k-NN)
- The Naive Bayes Classifier
- Classification and Regression Trees
- Logistic Regression
- Neural Nets
- Discriminant Analysis
- Combining Methods: Ensembles and Uplift Modeling
- Association Rules and Collaborative Filtering
- Cluster Analysis
- Handling Time Series
- Regression-Based Forecasting
- Smoothing Methods
- Social Network Analytics
- Text Mining
- Cases
فایل کتاب Data Mining for Business Analytics را میتوانید پس از پرداخت دانلود کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.