کتاب Data Science from Scratch Second Edition آموزش علم داده از ریشه است. این کتاب به بررسی کامل دادهکاوی، اهمیت آن و همچنین معرفی الگوریتمها و روشهای نوین دادهکای میپردازد. همچنین با استفاده از زبان برنامهنویسی قدرتمند پایتون به اجرای الگوریتمها و بررسی هر کدام از آنها در شرایط مختلف میپردازد.
منشأ پیدایش علم داده:
عبارت علم داده بیش از یک دهه است که موجودیت دارد. ویلیام کلیولند اولین کسی است که اصطلاح علم داده را در سال ۲۰۰۱ مطرح کرده است. وی در مقاله «علم داده: برنامهای برای گسترش جنبههای فنی در رشته آمار» پیشنهاد کرد که علم داده به عنوان یک رشته مستقل شناخته شود. کلیولند این رشته جدید را مرتبط با علوم کامپیوتر و دادهکاوی میدانست. وی بر این باور بود که منافع استفاده از یک تحلیلگر داده محدود است.
چون مهندسین کامپیوتر شناخت کمی از روشهای کار با داده دارند و دانش محاسباتی متخصصین آمار هم محدود است؛ بنابراین تلفیق این دو گروه میتواند منجر به نوآوریهای زیادی شود. دپارتمانهای علم داده باید اساتیدی داشته باشد که بتوانند دانش دادهها را با دانش محاسبات تلفیق کنند.
بیشتر بخوانید: کتاب Data Science Solutions with Python
متخصص علم داده:
به شاغلین در حوزهٔ علم داده، متخصص علم داده (data scientist) میگویند. این اصطلاح توسط دی جی پاتیل و جف همربارکر ابداع شده است در صورتی که سالها قبل از آن که آنها استفاده از اصطلاح فوق را بهطور عمومی مطرح کنند، از آن استفاده شدهاست.
چن فو جف وو در سال ۱۹۹۸ برای اولین بار در یک سخنرانی از واژهٔ متخصص علم داده استفاده کرد. متخصصین علم داده با عمیق شدن در چندین رشتهٔ علمی، مسائل پیچیدهٔ مطرح شده در حوزهٔ داده را حل میکنند. بهطور کلی انتظار میرود که متخصصین علم داده قادر باشند در بخشهایی از علوم ریاضیات و آمار و علوم کامپیوتر کار کنند. یک متخصص علم داده میبایست در یک یا دو رشته تخصص داشته باشد و در دیگر حوزهها دارای مهارت کافی باشد. نتایج نظرسنجیها حاکی از این موضوع است که برای متخصص علم داده شدن ۵ تا ۸ سال زمان لازم است.
متخصصین علم داده میتوانند مهارتهایشان را برای دست یابی به طیف وسیعی از نتایج نهایی به کار گیرند. تعدادی از این مهارتها به شرح زیرند:
- توانایی استخراج و تفسیر منابع داده
- مدیریت حجم زیاد اطلاعات با سختافزار
- محدودیتهای نرمافزاری و پهنای باند
- ادغام منابع داده با یک دیگر
- تضمین پایداری مجموعههای داده
- مصورسازی داده برای فهم آن
- ساخت مدلهای ریاضی با استفاده از داده، مانند مدلهای ریگرسیون و طبقهبندی
- مقایسه آماری مدلهای ریاضی گوناگون و انتخاب مدل برتر، فی المثل توسط آزمون آ/ب
- به اشتراک گذاری یافتهها و دیدگاهها در حوزه داده با متخصصان دیگر یا مخاطب عام
سرفصلهای کتاب Data Science from Scratch Second Edition:
- Introduction
- A Crash Course in Python
- Visualizing Data
- Linear Algebra
- Statistics
- Probability
- Hypothesis and Inference
- Gradient Descent
- Getting Data
- Working with Data
- Machine Learning
- k-Nearest Neighbors
- Naive Bayes
- Simple Linear Regression
- Multiple Regression
- Logistic Regression
- Decision Trees
- Neural Networks
- Deep Learning
- Clustering
- Natural Language Processing
- Network Analysis
- Recommender Systems
- Databases and SQL
- MapReduce
- Data Ethics
- Go Forth and Do Data Science
فایل کتاب Data Science from Scratch Second Edition را میتوانید پس از پرداخت دانلود کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.