کتاب Principles of Data Science, 3rd Edition: A beginner’s guide to essential math and coding skills for data fluency and machine learning (اصول علم داده، ویرایش سوم: راهنمای مبتدیان برای مهارتهای اساسی ریاضی و کدنویسی برای روانی دادهها و یادگیری ماشین) یک منبع کامل و جامع برای مهارتهای ریاضی و کدنویسی ضروری برای تسلط بر روانی دادهها و یادگیری ماشین است.
این کتاب در 15 فصل از مقدمات تا نکات مهم و پایه علوم داده را شرح میدهد.
در ادامه مقدمهای از کتاب Principles of Data Science را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Principles of Data Science:
اصول علم داده ریاضیات، برنامهنویسی و تجزیه و تحلیل کسب و کار را پل میزند و به شما این امکان را میدهد که با اطمینان سؤالات پیچیده داده را مطرح کنید و به آنها بپردازید و خطوط لوله یادگیری ماشینی مؤثری ایجاد کنید. این کتاب شما را با ابزارهایی که برای تبدیل مفاهیم انتزاعی و آمار خام به بینشهای عملی نیاز دارید، مجهز میکند.
با شروع تمیز کردن و آمادهسازی، استراتژیها و تکنیکهای مؤثر دادهکاوی را قبل از اینکه به ساختن تصویری جامع از نحوه تناسب هر قطعه از پازل علم داده با هم بپردازید، بررسی خواهید کرد.
در سرتاسر کتاب Principles of Data Science، مدلهای آماری را کشف خواهید کرد که با استفاده از آنها میتوانید حتی متراکمترین یا پراکندهترین مجموعههای داده را کنترل و پیمایش کنید و یاد بگیرید که چگونه تجسمهای قدرتمندی ایجاد کنید که داستانهای پنهان در دادههای شما را با هم ارتباط برقرار کند.
با تمرکز بر کاربرد، این نسخه یادگیری انتقال پیشرفته و مدلهای از پیش آموزش دیده برای وظایف NLP و بینایی را پوشش میدهد. شما با تکنیکهای پیشرفته برای کاهش تعصب الگوریتمی در دادهها و همچنین مدلها و آدرس دهی مدل و جابجایی دادهها آشنا خواهید شد.
در نهایت، مدیریت داده در سطح متوسط، از جمله منشأ داده، حریم خصوصی، و رسیدگی به درخواست حذف را بررسی خواهید کرد.
در پایان کتاب Principles of Data Science، شما اصول ریاضیات محاسباتی و آمار را یاد خواهید گرفت، همه اینها در حین پیمایش در پیچیدگیهای یادگیری ماشینی مدرن و مدلهای بزرگ از پیش آموزش دیده مانند GPT و BERT.
بیشتر بخوانید: کتاب Data Science for Web3
کتاب Principles of Data Science برای چه افرادی است؟
اگر شما یک دانشمند مبتدی داده و مشتاق به گسترش دانش خود هستید، این کتاب برای شما مناسب است. چه مهارتهای پایه ریاضی داشته باشید و بخواهید آنها را در زمینه علوم داده به کار ببرید، یا در برنامهنویسی عالی باشید اما پایههای ریاضی لازم را ندارید، این کتاب برای شما مفید خواهد بود. آشنایی با برنامهنویسی پایتون تجربه یادگیری شما را بیشتر میکند.
آنچه کتاب Principles of Data Science پوشش میدهد:
فصل ۱، اصطلاحات علم داده، اصطلاحات اساسی مورد استفاده توسط دانشمندان داده را شرح میدهد. ما تفاوتهای بین اصطلاحات اغلب گیجکننده را پوشش میدهیم و همچنین نمونههایی از هر اصطلاح مورد استفاده را بررسی میکنیم تا به طور واقعی نحوه برقراری ارتباط در زبان علم داده را درک کنیم.
ما با نگاهی به اصطلاح کلی علم داده شروع میکنیم و سپس، کم کم، دقیقتر میشویم تا زمانی که به زیر دامنههای منفرد علم داده، مانند یادگیری ماشین و استنتاج آماری برسیم.
این فصل از کتاب Principles of Data Science، همچنین به سه حوزه اصلی علم داده، که ریاضیات، برنامهنویسی و تخصص حوزه هستند، میپردازد. ما به هر یک به صورت جداگانه نگاه خواهیم کرد و کاربرد هر کدام را درک خواهیم کرد.
ما همچنین به بستههای پایه پایتون و نحوی که در سراسر کتاب Principles of Data Science استفاده میشود نگاه خواهیم کرد.
فصل دوم کتاب Principles of Data Science، انواع داده، به انواع دادهها و نحوه مشاهده دادهها میپردازد. ما سطوح مختلف داده و همچنین اشکال مختلف داده را بررسی خواهیم کرد. به طور خاص، تفاوتهای بین دادههای ساختاریافته/بدون ساختار، دادههای کمی/کیفی و موارد دیگر را درک خواهیم کرد.
فصل ۳، پنج مرحله علم داده، به فرآیند علم داده و همچنین بحث و آمادهسازی دادهها میپردازد. ما به پنج مرحله علم داده میرویم و در هر مرحله از این فرآیند نمونههایی از این فرآیند ارائه میکنیم.
بعد از اینکه پنج مرحله علم داده را پوشش دادیم، به بحث درگیری دادهها میپردازیم که مرحله اکتشاف/آمادهسازی دادهها از فرآیند است. به منظور درک بهتر این اصول، از مثالهای گسترده برای توضیح هر مرحله استفاده خواهیم کرد.
من همچنین نکاتی را ارائه خواهم داد که باید هنگام کاوش دادهها به دنبال آنها باشید، از جمله جستجوی دادهها در مقیاسهای مختلف، متغیرهای طبقهبندی شده، و دادههای از دست رفته. ما از پانداها برای بررسی و رفع همه این موارد استفاده خواهیم کرد.
فصل ۴، ریاضیات پایه، به مهارتهای ریاضی ابتدایی مورد نیاز هر دانشمند داده میپردازد. ما به تجزیه و تحلیل عملکردی میپردازیم و از جبر ماتریکی و همچنین حساب دیفرانسیل و انتگرال برای نشان دادن و اثبات نتایج مختلف بر اساس مشکلات دادههای دنیای واقعی استفاده میکنیم.
فصل ۵، غیرممکن یا غیرممکن – مقدمهای ملایم بر احتمال، به شدت بر احتمالات اساسی که برای علم داده مورد نیاز است تمرکز میکند.
ما با استفاده از قواعد احتمال نتایج را از دادهها استخراج خواهیم کرد و شروع به دیدن چگونگی مشاهده مشکلات دنیای واقعی با استفاده از احتمال خواهیم کرد.
این فصل از کتاب Principles of Data Science، بسیار کاربردی خواهد بود و از پایتون برای کدنویسی مثالها استفاده خواهد شد.
فصل ۶، احتمال پیشرفته، جایی است که ما نحوه استفاده از پایتون برای حل مسائل احتمالی پیچیدهتر را بررسی میکنیم و همچنین به نوع جدیدی از احتمال به نام استنتاج بیزی نگاه میکنیم. ما از این قضایا برای حل سناریوهای دادههای دنیای واقعی مانند پیشبینی آب و هوا استفاده خواهیم کرد.
فصل ۷، چه شانسی وجود دارد؟ مقدمهای بر آمار، در مورد آمار اولیه است که برای علم داده مورد نیاز است. همچنین انواع خطاهای آماری از جمله خطاهای نوع اول و دوم را با استفاده از مثالها بررسی خواهیم کرد.
این خطاها به اندازه نتایج واقعی برای تحلیل ما ضروری هستند. خطاها و انواع مختلف آنها به ما این امکان را میدهد که در نتیجهگیریهای خود عمیقتر کاوش کنیم و از نتایج بالقوه فاجعهآمیز اجتناب کنیم. پایتون برای کدنویسی مشکلات و نتایج آماری استفاده خواهد شد.
فصل ۸، آمار پیشرفته، جایی است که عادیسازی کلیدی است. درک اینکه چرا و چگونه دادهها را عادی میکنیم بسیار مهم خواهد بود. ما نمودارهای اساسی مانند نمودارهای پراکنده، نمودارهای نواری و هیستوگرام را پوشش خواهیم داد. این فصل از کتاب Principles of Data Science، همچنین به مدلسازی آماری با استفاده از دادهها میپردازد.
ما نه تنها این مفهوم را به عنوان استفاده از ریاضیات برای مدلسازی یک موقعیت دنیای واقعی تعریف میکنیم، بلکه از دادههای واقعی نیز برای برونیابی مدلهای آماری خود استفاده خواهیم کرد. ما همچنین در مورد بیش از حد مناسب صحبت خواهیم کرد. پایتون برای کدنویسی مشکلات و نتایج آماری استفاده خواهد شد.
فصل ۹، ارتباط دادهها، به روشهای مختلف ارتباط نتایج حاصل از تجزیه و تحلیل ما میپردازد. ما به سبکهای مختلف ارائه و همچنین تکنیکهای مختلف تجسم نگاه خواهیم کرد.
هدف این فصل از کتاب Principles of Data Science، این است که نتایج ما را در نظر بگیریم و بتوانیم آنها را به روشی منسجم و قابل فهم توضیح دهیم تا هر کسی، خواه به دادهها دانا باشد یا نه، بتواند نتایج ما را بفهمد و از آنها استفاده کند.
بسیاری از مواردی که در مورد آن بحث خواهیم کرد نحوه ایجاد نمودارهای مؤثر از طریق برچسبها، کلیدها، رنگها و موارد دیگر خواهد بود. ما همچنین به تکنیکهای تجسم پیشرفتهتری مانند نمودار مختصات موازی نگاه خواهیم کرد.
فصل ۱۰، چگونه بفهمیم که توستر شما در حال یادگیری است – اصول یادگیری ماشین، بر یادگیری ماشین به عنوان بخشی از علم داده تمرکز دارد. ما انواع مختلف یادگیری ماشین را تعریف میکنیم و نمونههایی از هر نوع را مشاهده میکنیم. ما به طور خاص حوزههای رگرسیون، طبقهبندی و یادگیری بدون نظارت را پوشش خواهیم داد.
این فصل از کتاب Principles of Data Science، به چیستی یادگیری ماشین و نحوه استفاده از آن در علم داده میپردازد. ما تفاوتهای بین یادگیری ماشین و مدلسازی آماری و اینکه چگونه یادگیری ماشین مقوله وسیعتری از دومی است را دوباره بررسی خواهیم کرد. هدف ما استفاده از آمار و احتمال به منظور درک و به کارگیری مهارتهای یادگیری ماشین ضروری در صنایع عملی مانند بازاریابی خواهد بود.
مثالها شامل پیشبینی رتبهبندی ستارههای مرور رستورانها، پیشبینی وجود بیماری، شناساییایمیلهای هرزنامه و موارد دیگر است. این فصل از کتاب Principles of Data Science، بیشتر بر روی مدلهای آماری و احتمالاتی تمرکز دارد.
فصل بعدی به مدلهایی میپردازد که در این دسته قرار نمیگیرند. ما همچنین بر معیارهایی تمرکز خواهیم کرد که به ما میگویند مدلهای ما چقدر دقیق هستند. ما از معیارها برای نتیجهگیری نتایج و پیشبینی با استفاده از یادگیری ماشین استفاده خواهیم کرد.
فصل ۱۱، پیشبینیها روی درختان رشد نمیکنند یا آیا؟ ، به شدت بر یادگیری ماشینی تمرکز دارد که یک مدل آماری یا احتمالی در نظر گرفته نمیشود. اینها مدلهایی را تشکیل میدهند که نمیتوان آنها را در یک معادله قرار داد، مانند رگرسیون خطی یا بیز ساده. مدلهای این فصل از کتاب Principles of Data Science، در حالی که هنوز بر اساس اصول ریاضی هستند، پیچیدهتر از یک معادله هستند.
این مدلها شامل KNN، درختهای تصمیمگیری و مقدمهای بر خوشهبندی بدون نظارت است. معیارها در اینجا بسیار مهم خواهند شد زیرا مبنایی برای اندازهگیری درک و مدلهای ما خواهند بود.
ما همچنین در این فصل از کتاب Principles of Data Science به برخی از اصول اخلاقی علم داده نگاه خواهیم کرد. ما خواهیم دید که یادگیری ماشین ممکن است در زمینههایی مانند حریم خصوصی و تبلیغات مرزبندی کند و سعی کنیم در مورد اخلاق پیشبینیها نتیجهگیری کنیم.
فصل ۱۲، مقدمهای بر یادگیری انتقال و مدلهای از پیش آموزشدیده، یادگیری انتقالی را معرفی میکند و مثالهایی از نحوه انتقال یادگیری ماشین از یک مدل از پیش آموزشدیده به مدلهای تنظیمشده ارائه میدهد. ما در دنیای مدلهای منبع باز پیمایش خواهیم کرد و به عملکردی پیشرفته در NLP و وظایف بینایی دست خواهیم یافت.
فصل ۱۳، کاهش تعصب الگوریتمی و مقابله با مدل و دریفت داده، سوگیری الگوریتمی و نحوه کمیسازی، شناسایی و کاهش تعصبات در دادهها و مدلها را معرفی میکند. خواهیم دید که چگونه دادههای بایاس میتوانند به مدلهای سوگیری منجر شوند. همچنین خواهیم دید که چگونه میتوانیم سوگیری را در اسرع وقت شناسایی کنیم و سوگیریهای جدیدی را که در مدلهای موجود ایجاد میشود، پیدا کنیم.
فصل ۱۴ کتاب Principles of Data Science، مدیریت هوش مصنوعی، رانش در مدلها و دادهها و روشهای مناسب برای کمیتسازی و مبارزه با رانش را معرفی میکند. ما خواهیم دید که چگونه دادهها میتوانند در طول زمان جابجا شوند و چگونه میتوانیم مدلها را به درستی برای مبارزه با پیشنویس به روز کنیم تا خطوط لوله خود را تا حد ممکن کارآمد نگه داریم.
فصل ۱۵، پیمایش در مطالعات موردی علم داده در دنیای واقعی، ساختارهای حاکمیتی اساسی و نحوه پیمایش درخواستهای حذف، ساختارهای حریم خصوصی/مجوز، و منشأ داده را معرفی میکند.
سرفصلهای کتاب Principles of Data Science:
- Principles of Data Science
- Contributor
- About the author
- About the reviewer
- Preface
- Chapter 1: Data Science Terminology
- Chapter 2: Types of Data
- Chapter 3: The Five Steps of Data Science
- Chapter 4: Basic Mathematics
- Chapter 5: Impossible or Improbable – A Gentle Introduction to Probability
- Chapter 6: Advanced Probability
- Chapter 7: What Are the Chances? An Introduction to Statistics
- Chapter 8: Advanced Statistics
- Chapter 9: Communicating Data
- Chapter 10: How to Tell if Your Toaster is Learning – Machine Learning Essentials
- Chapter 11: Predictions Don’t Grow on Trees, or Do They?
- Chapter 12: Introduction to Transfer Learning and Pre-Trained Models
- Chapter 13: Mitigating Algorithmic Bias and Tackling Model and Data Drift
- Chapter 14: Al Governance
- Chapter 15: Navigating Real-World Data Science Case Studies in Action Index
- Other Books You May Enjoy
جهت دانلود کتاب Principles of Data Science میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.