کتاب Essential Math for Data Science با تلفیق ریاضیات با علوم داده، مفاهیم علوم داده را برای شما با زبان ساده بیان میکند. این کتاب در 8 فصل ریاضیات مربوط به علوم داده را آموزش داده و آنها را در دنیای واقعی با زبان برنامهنویسی پایتون پیادهسازی میکند.
در ادامه مقدمهای از کتاب Essential Math for Data Science را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Essential Math for Data Science:
در حدود 10 سال گذشته، علاقه فزاینده ای به استفاده از ریاضی و آمار در کار و زندگی روزمره ما وجود داشته است. چرا اینطور است؟ آیا این موضوع با علاقه شتابان به «علم داده»، که هاروارد بیزینس ریویو آن را «سکسی ترین شغل قرن بیست و یکم» نامیده است، ارتباط دارد؟ یا اینکه نوید یادگیری ماشین و “هوش مصنوعی” زندگی ما را تغییر میدهد؟ آیا به این دلیل است که سرفصلهای اخبار مملو از مطالعات، نظرسنجیها و یافتههای پژوهشی است اما مطمئن نیستید که چگونه چنین ادعاهایی را بررسی کنید؟ یا اینکه این وعده ماشینها و رباتهای “خودران” است که مشاغل را در آینده نزدیک خودکار میکنند؟
من این بحث را مطرح میکنم که رشتههای ریاضی و آمار به دلیل در دسترس بودن رو به رشد دادهها مورد توجه جریان اصلی قرار گرفتهاند و برای درک آن به ریاضیات، آمار و یادگیری ماشین نیاز داریم. بله، ما ابزارهای علمی، یادگیری ماشینی و سایر اتوماسیونهایی داریم که مانند آژیر ما را صدا میکنند. ما کورکورانه به این «جعبههای سیاه»، دستگاهها و نرمافزارها اعتماد داریم. ما آنها را درک نمیکنیم اما به هر حال از آنها استفاده میکنیم.
در حالی که به راحتی میتوان باور کرد که رایانهها از ما باهوشتر هستند (و این ایده اغلب به بازار عرضه میشود)، واقعیت نمیتواند بیشتر برعکس باشد. این قطع ارتباط در سطوح مختلف میتواند مخاطرهآمیز باشد. آیا واقعاً یک الگوریتم یا هوش مصنوعی برای اجرای احکام جنایی یا رانندگی یک وسیله نقلیه میخواهید، اما هیچکس از جمله توسعه دهنده نمیتواند توضیح دهد که چرا تصمیم خاصی گرفته است؟ توضیح پذیری مرز بعدی محاسبات آماری و هوش مصنوعی است. این فقط زمانی میتواند شروع شود که جعبه سیاه را باز کنیم و ریاضیات را کشف کنیم.
همچنین ممکن است بپرسید چگونه یک توسعهدهنده نمیداند الگوریتم خودش چگونه کار میکند؟ در نیمه دوم کتاب Essential Math for Data Science، زمانی که درباره تکنیکهای یادگیری ماشین بحث میکنیم و تأکید میکنیم که چرا باید ریاضیات پشت جعبههای سیاهی که میسازیم را درک کنیم، در مورد آن صحبت خواهیم کرد.
از نقطهای دیگر، دلیل جمعآوری دادهها در مقیاس گسترده عمدتاً به دلیل دستگاههای متصل و حضور آنها در زندگی روزمره ما است. ما دیگر فقط از اینترنت روی رایانه رومیزی یا لپتاپ استفاده نمیکنیم. ما اکنون آن را در گوشیهای هوشمند، خودروها و دستگاههای خانگی خود با خود میبریم.
این امر به طرز ماهرانه ای یک انتقال را در دو دهه گذشته امکانپذیر کرده است. اکنون دادهها از یک ابزار عملیاتی به چیزی تبدیل شده است که برای اهداف کمتر تعریف شده جمع آوری و تجزیه و تحلیل میشود. یک ساعت هوشمند دائماً در حال جمعآوری اطلاعات در مورد ضربان قلب، تنفس، مسافت پیادهروی و سایر نشانگرها است.
سپس آن دادهها را در یک ابر آپلود میکند تا در کنار سایر کاربران تجزیه و تحلیل شود. عادات رانندگی ما توسط ماشینهای کامپیوتری جمعآوری میشود و توسط تولید کنندگان برای جمع آوری دادهها و فعال کردن وسایل نقلیه خودران استفاده میشود. حتی «مسواکهای هوشمند» هم به داروخانهها راه پیدا میکنند که عادتهای مسواک زدن را دنبال میکنند و این دادهها را در یک ابر ذخیره میکنند. اینکه دادههای مسواک هوشمند مفید و ضروری است یا خیر بحث دیگری است!
همه این مجموعه دادهها در گوشه و کنار زندگی ما نفوذ کرده است. ممکن است بسیار زیاد باشد، و میتوان یک کتاب کامل در مورد نگرانیهای حفظ حریم خصوصی و اخلاقیات نوشت. اما این در دسترس بودن دادهها همچنین فرصتهایی را برای استفاده از ریاضیات و آمار به روشهای جدید و ایجاد قرار گرفتن در معرض بیشتر در خارج از محیطهای دانشگاهی ایجاد میکند. ما میتوانیم درباره تجربیات انسانی بیشتر بیاموزیم، طراحی و کاربرد محصول را بهبود بخشیم، و استراتژیهای تجاری را بهینه کنیم.
اگر ایدههای ارائه شده در کتاب Essential Math for Data Science را درک کنید، میتوانید ارزش موجود در زیرساخت ذخیره داده ما را باز کنید. این بدان معنا نیست که دادهها و ابزارهای آماری یک گلوله نقره ای برای حل همه مشکلات جهان هستند، اما آنها ابزارهای جدیدی را در اختیار ما قرار داده اند که میتوانیم از آنها استفاده کنیم. گاهی اوقات تشخیص پروژههای دادهای خاص به اندازه سوراخهای خرگوش و درک اینکه تلاشها در جای دیگر بهتر خرج میشوند، ارزشمند است.
این در دسترس بودن روزافزون دادهها، راه را برای علم داده و یادگیری ماشین به حرفههای مورد تقاضا تبدیل کرده است. ما ریاضیات ضروری را به عنوان قرار گرفتن در معرض احتمال، جبر خطی، آمار و یادگیری ماشین تعریف میکنیم. اگر به دنبال شغلی در علم داده، یادگیری ماشین یا مهندسی هستید، این موضوعات ضروری هستند. من فقط به اندازه کافی ریاضیات، حساب دیفرانسیل و انتگرال، و آمار لازم را برای درک بهتر آنچه در کتابخانههای جعبه سیاهی که با آنها روبرو خواهید شد، استفاده میکنم.
با کتاب Essential Math for Data Science، هدف من این است که خوانندگان را با حوزههای مختلف ریاضی، آماری و یادگیری ماشینی آشنا کنم که برای مسائل دنیای واقعی قابل استفاده است. چهار فصل اول مفاهیم پایه ریاضی از جمله حساب عملی، احتمال، جبر خطی و آمار را پوشش میدهد.
سه فصل آخر کتاب Essential Math for Data Science به یادگیری ماشین میپردازد. هدف نهایی آموزش یادگیری ماشینی، ادغام همه چیزهایی است که میآموزیم و نشان دادن بینشهای عملی در استفاده از یادگیری ماشینی و کتابخانههای آماری فراتر از درک جعبه سیاه.
تنها ابزار مورد نیاز برای دنبال کردن مثالها یک کامپیوتر Windows/Mac/Linux و یک محیط Python 3 به انتخاب شماست. کتابخانههای اولیه پایتون که به آنها نیاز خواهیم داشت numpy، scipy، sympy و sklearn هستند. اگر با پایتون آشنایی ندارید، این یک زبان برنامهنویسی دوستانه و آسان برای استفاده است و منابع یادگیری عظیمی در پشت آن قرار دارد. در اینجا برخی از آنها توصیه میشود:
علم داده از ابتدا، ویرایش دوم توسط جوئل گروس (اوریلی)
فصل دوم کتاب Essential Math for Data Science بهترین دوره crash در پایتون را دارد که من با آن مواجه شدم. حتی اگر قبلاً هرگز کدی ننوشتهاید، جوئل کار فوقالعادهای انجام میدهد که شما را در کوتاهترین زمان ممکن با پایتون بهطور مؤثر راهاندازی میکند. همچنین یک کتاب عالی است که در قفسه خود داشته باشید و دانش ریاضی خود را به کار ببرید!
Python for the Busy Java Developer توسط Deepak Sarda (Apress)
اگر شما یک مهندس نرمافزار هستید که از پس زمینه برنامهنویسی شیگرا و دارای تایپ ایستا میآیید، این کتابی است که باید به دست آورید. من به عنوان فردی که برنامهنویسی را با جاوا شروع کردم، از نحوه اشتراکگذاری ویژگیهای Python و ارتباط آنها با توسعهدهندگان جاوا توسط Deepak بسیار قدردانی میکنم. اگر داتنت، سیپلاسپلاس یا سایر زبانهای شبیه به سی را انجام دادهاید، احتمالاً پایتون را نیز از این کتاب بهطور مؤثر یاد خواهید گرفت.
کتاب Essential Math for Data Science شما را متخصص نمیکند و دانش دکترا را به شما نمیدهد. من تمام تلاشم را میکنم تا از عبارات ریاضی پر از نمادهای یونانی اجتناب کنم و در عوض سعی میکنم از انگلیسی ساده به جای آن استفاده کنم.
اما کاری که کتاب Essential Math for Data Science انجام میدهد این است که شما را راحت تر در مورد ریاضی و آمار صحبت میکند و به شما دانش ضروری برای پیمایش موفقیت آمیز این حوزهها میدهد. من معتقدم وسیعترین مسیر موفقیت، داشتن دانش عمیق و تخصصی در یک موضوع نیست، بلکه داشتن دانش و آگاهی عملی در چندین موضوع است. این هدف این کتاب است، و شما آنقدر یاد خواهید گرفت که خطرناک باشید و آن سوالات انتقادی را که زمانی گریزان بود بپرسید.
سرفصلهای کتاب Essential Math for Data Science:
- Preface
- 1. Basic Math and Calculus Review
- 2. Probability
- 3. Descriptive and Inferential Statistics
- 4. Linear Algebra
- 5. Linear Regression
- 6. Logistic Regression and Classification
- 7. Neural Networks
- 8. Career Advice and the Path Forward
- A. Supplemental Topics
- B. Exercise Answers
- Index
- About the Author
فایل کتاب Essential Math for Data Science را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.