کتاب Principles of Data Science, 3rd Edition: A beginner’s guide to essential math and coding skills for data fluency and machine learning (اصول علم داده، ویرایش سوم: راهنمای مبتدیان برای مهارت‌های اساسی ریاضی و کدنویسی برای روانی داده‌ها و یادگیری ماشین) یک منبع کامل و جامع برای مهارت‌های ریاضی و کدنویسی ضروری برای تسلط بر روانی داده‌ها و یادگیری ماشین است.

این کتاب در 15 فصل از مقدمات تا نکات مهم و پایه علوم داده را شرح می‌دهد.

در ادامه مقدمه‌ای از کتاب Principles of Data Science را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Principles of Data Science:

اصول علم داده ریاضیات، برنامه‌نویسی و تجزیه و تحلیل کسب و کار را پل می‌زند و به شما این امکان را می‌دهد که با اطمینان سؤالات پیچیده داده را مطرح کنید و به آن‌ها بپردازید و خطوط لوله یادگیری ماشینی مؤثری ایجاد کنید. این کتاب شما را با ابزار‌هایی که برای تبدیل مفاهیم انتزاعی و آمار خام به بینش‌های عملی نیاز دارید، مجهز می‌کند.

با شروع تمیز کردن و آماده‌سازی، استراتژی‌ها و تکنیک‌های مؤثر داده‌کاوی را قبل از اینکه به ساختن تصویری جامع از نحوه تناسب هر قطعه از پازل علم داده با هم بپردازید، بررسی خواهید کرد.

در سرتاسر کتاب Principles of Data Science، مدل‌های آماری را کشف خواهید کرد که با استفاده از آن‌ها می‌توانید حتی متراکم‌ترین یا پراکنده‌ترین مجموعه‌های داده را کنترل و پیمایش کنید و یاد بگیرید که چگونه تجسم‌های قدرتمندی ایجاد کنید که داستان‌های پنهان در داده‌های شما را با هم ارتباط برقرار کند.

با تمرکز بر کاربرد، این نسخه یادگیری انتقال پیشرفته و مدل‌های از پیش آموزش دیده برای وظایف NLP و بینایی را پوشش می‌دهد. شما با تکنیک‌های پیشرفته برای کاهش تعصب الگوریتمی در داده‌ها و همچنین مدل‌ها و آدرس دهی مدل و جابجایی داده‌ها آشنا خواهید شد.

در نهایت، مدیریت داده در سطح متوسط، از جمله منشأ داده، حریم خصوصی، و رسیدگی به درخواست حذف را بررسی خواهید کرد.

در پایان کتاب Principles of Data Science، شما اصول ریاضیات محاسباتی و آمار را یاد خواهید گرفت، همه این‌ها در حین پیمایش در پیچیدگی‌های یادگیری ماشینی مدرن و مدل‌های بزرگ از پیش آموزش دیده مانند GPT و BERT.

بیشتر بخوانید: کتاب Data Science for Web3

کتاب Principles of Data Science برای چه افرادی است؟

اگر شما یک دانشمند مبتدی داده و مشتاق به گسترش دانش خود هستید، این کتاب برای شما مناسب است. چه مهارت‌های پایه ریاضی داشته باشید و بخواهید آن‌ها را در زمینه علوم داده به کار ببرید، یا در برنامه‌نویسی عالی باشید اما پایه‌های ریاضی لازم را ندارید، این کتاب برای شما مفید خواهد بود. آشنایی با برنامه‌نویسی پایتون تجربه یادگیری شما را بیشتر می‌کند.

آنچه کتاب Principles of Data Science پوشش می‌دهد:

فصل ۱، اصطلاحات علم داده، اصطلاحات اساسی مورد استفاده توسط دانشمندان داده را شرح می‌دهد. ما تفاوت‌های بین اصطلاحات اغلب گیج‌کننده را پوشش می‌دهیم و همچنین نمونه‌هایی از هر اصطلاح مورد استفاده را بررسی می‌کنیم تا به طور واقعی نحوه برقراری ارتباط در زبان علم داده را درک کنیم.

ما با نگاهی به اصطلاح کلی علم داده شروع می‌کنیم و سپس، کم کم، دقیق‌تر می‌شویم تا زمانی که به زیر دامنه‌های منفرد علم داده، مانند یادگیری ماشین و استنتاج آماری برسیم.

این فصل از کتاب Principles of Data Science، همچنین به سه حوزه اصلی علم داده، که ریاضیات، برنامه‌نویسی و تخصص حوزه هستند، می‌پردازد. ما به هر یک به صورت جداگانه نگاه خواهیم کرد و کاربرد هر کدام را درک خواهیم کرد.

ما همچنین به بسته‌های پایه پایتون و نحوی که در سراسر کتاب Principles of Data Science استفاده می‌شود نگاه خواهیم کرد.

فصل دوم کتاب Principles of Data Science، انواع داده، به انواع داده‌ها و نحوه مشاهده داده‌ها می‌پردازد. ما سطوح مختلف داده و همچنین اشکال مختلف داده را بررسی خواهیم کرد. به طور خاص، تفاوت‌های بین داده‌های ساختاریافته/بدون ساختار، داده‌های کمی/کیفی و موارد دیگر را درک خواهیم کرد.

فصل ۳، پنج مرحله علم داده، به فرآیند علم داده و همچنین بحث و آماده‌سازی داده‌ها می‌پردازد. ما به پنج مرحله علم داده می‌رویم و در هر مرحله از این فرآیند نمونه‌هایی از این فرآیند ارائه می‌کنیم.

بعد از اینکه پنج مرحله علم داده را پوشش دادیم، به بحث درگیری داده‌ها می‌پردازیم که مرحله اکتشاف/آماده‌سازی داده‌ها از فرآیند است. به منظور درک بهتر این اصول، از مثال‌های گسترده برای توضیح هر مرحله استفاده خواهیم کرد.

من همچنین نکاتی را ارائه خواهم داد که باید هنگام کاوش داده‌ها به دنبال آن‌ها باشید، از جمله جستجوی داده‌ها در مقیاس‌های مختلف، متغیر‌های طبقه‌بندی شده، و داده‌های از دست رفته. ما از پاندا‌ها برای بررسی و رفع همه این موارد استفاده خواهیم کرد.

فصل ۴، ریاضیات پایه، به مهارت‌های ریاضی ابتدایی مورد نیاز هر دانشمند داده می‌پردازد. ما به تجزیه و تحلیل عملکردی می‌پردازیم و از جبر ماتریکی و همچنین حساب دیفرانسیل و انتگرال برای نشان دادن و اثبات نتایج مختلف بر اساس مشکلات داده‌های دنیای واقعی استفاده می‌کنیم.

فصل ۵، غیرممکن یا غیرممکن – مقدمه‌ای ملایم بر احتمال، به شدت بر احتمالات اساسی که برای علم داده مورد نیاز است تمرکز می‌کند.

ما با استفاده از قواعد احتمال نتایج را از داده‌ها استخراج خواهیم کرد و شروع به دیدن چگونگی مشاهده مشکلات دنیای واقعی با استفاده از احتمال خواهیم کرد.

این فصل از کتاب Principles of Data Science، بسیار کاربردی خواهد بود و از پایتون برای کدنویسی مثال‌ها استفاده خواهد شد.

فصل ۶، احتمال پیشرفته، جایی است که ما نحوه استفاده از پایتون برای حل مسائل احتمالی پیچیده‌تر را بررسی می‌کنیم و همچنین به نوع جدیدی از احتمال به نام استنتاج بیزی نگاه می‌کنیم. ما از این قضایا برای حل سناریو‌های داده‌های دنیای واقعی مانند پیش‌بینی آب و هوا استفاده خواهیم کرد.

فصل ۷، چه شانسی وجود دارد؟ مقدمه‌ای بر آمار، در مورد آمار اولیه است که برای علم داده مورد نیاز است. همچنین انواع خطا‌های آماری از جمله خطا‌های نوع اول و دوم را با استفاده از مثال‌ها بررسی خواهیم کرد.

این خطا‌ها به اندازه نتایج واقعی برای تحلیل ما ضروری هستند. خطا‌ها و انواع مختلف آن‌ها به ما این امکان را می‌دهد که در نتیجه‌گیری‌های خود عمیق‌تر کاوش کنیم و از نتایج بالقوه فاجعه‌آمیز اجتناب کنیم. پایتون برای کدنویسی مشکلات و نتایج آماری استفاده خواهد شد.

فصل ۸، آمار پیشرفته، جایی است که عادی‌سازی کلیدی است. درک اینکه چرا و چگونه داده‌ها را عادی می‌کنیم بسیار مهم خواهد بود. ما نمودار‌های اساسی مانند نمودار‌های پراکنده، نمودار‌های نواری و هیستوگرام را پوشش خواهیم داد. این فصل از کتاب Principles of Data Science، همچنین به مدل‌سازی آماری با استفاده از داده‌ها می‌پردازد.

ما نه تنها این مفهوم را به عنوان استفاده از ریاضیات برای مدل‌سازی یک موقعیت دنیای واقعی تعریف می‌کنیم، بلکه از داده‌های واقعی نیز برای برون‌یابی مدل‌های آماری خود استفاده خواهیم کرد. ما همچنین در مورد بیش از حد مناسب صحبت خواهیم کرد. پایتون برای کدنویسی مشکلات و نتایج آماری استفاده خواهد شد.

فصل ۹، ارتباط داده‌ها، به روش‌های مختلف ارتباط نتایج حاصل از تجزیه و تحلیل ما می‌پردازد. ما به سبک‌های مختلف ارائه و همچنین تکنیک‌های مختلف تجسم نگاه خواهیم کرد.

هدف این فصل از کتاب Principles of Data Science، این است که نتایج ما را در نظر بگیریم و بتوانیم آن‌ها را به روشی منسجم و قابل فهم توضیح دهیم تا هر کسی، خواه به داده‌ها دانا باشد یا نه، بتواند نتایج ما را بفهمد و از آن‌ها استفاده کند.

بسیاری از مواردی که در مورد آن بحث خواهیم کرد نحوه ایجاد نمودار‌های مؤثر از طریق برچسب‌ها، کلید‌ها، رنگ‌ها و موارد دیگر خواهد بود. ما همچنین به تکنیک‌های تجسم پیشرفته‌تری مانند نمودار مختصات موازی نگاه خواهیم کرد.

فصل ۱۰، چگونه بفهمیم که توستر شما در حال یادگیری است – اصول یادگیری ماشین، بر یادگیری ماشین به عنوان بخشی از علم داده تمرکز دارد. ما انواع مختلف یادگیری ماشین را تعریف می‌کنیم و نمونه‌هایی از هر نوع را مشاهده می‌کنیم. ما به طور خاص حوزه‌های رگرسیون، طبقه‌بندی و یادگیری بدون نظارت را پوشش خواهیم داد.

این فصل از کتاب Principles of Data Science، به چیستی یادگیری ماشین و نحوه استفاده از آن در علم داده می‌پردازد. ما تفاوت‌های بین یادگیری ماشین و مدل‌سازی آماری و اینکه چگونه یادگیری ماشین مقوله وسیع‌تری از دومی است را دوباره بررسی خواهیم کرد. هدف ما استفاده از آمار و احتمال به منظور درک و به کارگیری مهارت‌های یادگیری ماشین ضروری در صنایع عملی مانند بازاریابی خواهد بود.

مثال‌ها شامل پیش‌بینی رتبه‌بندی ستاره‌های مرور رستوران‌ها، پیش‌بینی وجود بیماری، شناسایی‌ایمیل‌های هرزنامه و موارد دیگر است. این فصل از کتاب Principles of Data Science، بیشتر بر روی مدل‌های آماری و احتمالاتی تمرکز دارد.

فصل بعدی به مدل‌هایی می‌پردازد که در این دسته قرار نمی‌گیرند. ما همچنین بر معیار‌هایی تمرکز خواهیم کرد که به ما می‌گویند مدل‌های ما چقدر دقیق هستند. ما از معیار‌ها برای نتیجه‌گیری نتایج و پیش‌بینی با استفاده از یادگیری ماشین استفاده خواهیم کرد.

فصل ۱۱، پیش‌بینی‌ها روی درختان رشد نمی‌کنند یا آیا؟ ، به شدت بر یادگیری ماشینی تمرکز دارد که یک مدل آماری یا احتمالی در نظر گرفته نمی‌شود. این‌ها مدل‌هایی را تشکیل می‌دهند که نمی‌توان آن‌ها را در یک معادله قرار داد، مانند رگرسیون خطی یا بیز ساده. مدل‌های این فصل از کتاب Principles of Data Science، در حالی که هنوز بر اساس اصول ریاضی هستند، پیچیده‌تر از یک معادله هستند.

این مدل‌ها شامل KNN، درخت‌های تصمیم‌گیری و مقدمه‌ای بر خوشه‌بندی بدون نظارت است. معیار‌ها در اینجا بسیار مهم خواهند شد زیرا مبنایی برای اندازه‌گیری درک و مدل‌های ما خواهند بود.

ما همچنین در این فصل از کتاب Principles of Data Science به برخی از اصول اخلاقی علم داده نگاه خواهیم کرد. ما خواهیم دید که یادگیری ماشین ممکن است در زمینه‌هایی مانند حریم خصوصی و تبلیغات مرزبندی کند و سعی کنیم در مورد اخلاق پیش‌بینی‌ها نتیجه‌گیری کنیم.

فصل ۱۲، مقدمه‌ای بر یادگیری انتقال و مدل‌های از پیش آموزش‌دیده، یادگیری انتقالی را معرفی می‌کند و مثال‌هایی از نحوه انتقال یادگیری ماشین از یک مدل از پیش آموزش‌دیده به مدل‌های تنظیم‌شده ارائه می‌دهد. ما در دنیای مدل‌های منبع باز پیمایش خواهیم کرد و به عملکردی پیشرفته در NLP و وظایف بینایی دست خواهیم یافت.

فصل ۱۳، کاهش تعصب الگوریتمی و مقابله با مدل و دریفت داده، سوگیری الگوریتمی و نحوه کمی‌سازی، شناسایی و کاهش تعصبات در داده‌ها و مدل‌ها را معرفی می‌کند. خواهیم دید که چگونه داده‌های بایاس می‌توانند به مدل‌های سوگیری منجر شوند. همچنین خواهیم دید که چگونه می‌توانیم سوگیری را در اسرع وقت شناسایی کنیم و سوگیری‌های جدیدی را که در مدل‌های موجود ایجاد می‌شود، پیدا کنیم.

فصل ۱۴ کتاب Principles of Data Science، مدیریت هوش مصنوعی، رانش در مدل‌ها و داده‌ها و روش‌های مناسب برای کمیت‌سازی و مبارزه با رانش را معرفی می‌کند. ما خواهیم دید که چگونه داده‌ها می‌توانند در طول زمان جابجا شوند و چگونه می‌توانیم مدل‌ها را به درستی برای مبارزه با پیش‌نویس به روز کنیم تا خطوط لوله خود را تا حد ممکن کارآمد نگه داریم.

فصل ۱۵، پیمایش در مطالعات موردی علم داده در دنیای واقعی، ساختار‌های حاکمیتی اساسی و نحوه پیمایش درخواست‌های حذف، ساختار‌های حریم خصوصی/مجوز، و منشأ داده را معرفی می‌کند.

سرفصل‌های کتاب Principles of Data Science:

Principles of Data Science
Contributor
About the author
About the reviewer
Preface
Chapter 1: Data Science Terminology
Chapter 2: Types of Data
Chapter 3: The Five Steps of Data Science
Chapter 4: Basic Mathematics
Chapter 5: Impossible or Improbable – A Gentle Introduction to Probability
Chapter 6: Advanced Probability
Chapter 7: What Are the Chances? An Introduction to Statistics
Chapter 8: Advanced Statistics
Chapter 9: Communicating Data
Chapter 10: How to Tell if Your Toaster is Learning – Machine Learning Essentials
Chapter 11: Predictions Don’t Grow on Trees, or Do They?
Chapter 12: Introduction to Transfer Learning and Pre-Trained Models
Chapter 13: Mitigating Algorithmic Bias and Tackling Model and Data Drift
Chapter 14: Al Governance
Chapter 15: Navigating Real-World Data Science Case Studies in Action Index
Other Books You May Enjoy

جهت دانلود کتاب Principles of Data Science می‌توانید پس از پرداخت، دریافت کنید.

فرمت کتاب	epub
ویرایش	Third
ISBN	978-1-83763-630-3
تعداد صفحات	326
انتشارات	Packt
سال انتشار	2024
حجم	13.67 مگابایت
نویسنده	Sinan Ozdemir

دیدگاهها

هیچ دیدگاهی برای این محصول نوشته نشده است.

اولین نفری باشید که دیدگاهی را ارسال می کنید برای “کتاب Principles of Data Science”

کتاب Principles of Data Science

خرید کتاب Principles of Data Science:

مقدمه‌ای بر کتاب Principles of Data Science:

سرفصل‌های کتاب Principles of Data Science:

دیدگاهها

خرید کتاب Principles of Data Science:

دسته‌یندی کتاب‌ها:

کتاب های پیشنهادی:

دسته بندی پیشنهادی

اعتبار ما: