کتاب Python Data Science Handbook (راهنمای علوم داده پایتون: ابزارهای ضروری برای کار با دادهها، ویرایش دوم) یک منبع کامل و کاربردی برای یادگیری زبان برنامهنویسی پایتون جهت به کارگیری در علوم داده است. این کتاب در 50 فصل به صورت مفصل ابزارهای پایتون را شرح داده و کار با آنها را در علم داده شرح خواهد داد.
در ادامه مقدمهای از کتاب Python Data Science Handbook را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Python Data Science Handbook:
در تدریس خود هم در دانشگاه واشنگتن و هم در کنفرانسها و جلسات مختلف با محوریت فناوری، یکی از رایج ترین سؤالاتی که شنیدهام این است: “چگونه باید پایتون را یاد بگیرم؟” افرادی که سؤال میکنند عموماً دانشآموزان، توسعهدهندگان یا محققین فنی هستند که اغلب دارای پیشینه قوی در نوشتن کد و استفاده از ابزارهای محاسباتی و عددی هستند.
اکثر این افراد به خودی خود نمیخواهند پایتون را یاد بگیرند، بلکه میخواهند این زبان را با هدف استفاده از آن به عنوان ابزاری برای علوم محاسباتی و داده فشرده یاد بگیرند. در حالی که مجموعه بزرگی از ویدیوها، پستهای وبلاگ و آموزشها برای این مخاطبان به صورت آنلاین در دسترس است، مدتهاست که از نبود یک پاسخ خوب واحد برای این سؤال ناامید شدهام. این چیزی است که الهام بخش این کتاب است.
کتاب Python Data Science Handbook قرار نیست مقدمه ای برای پایتون یا به طور کلی برنامه نویسی باشد. من فرض میکنم خواننده با زبان پایتون، از جمله تعریف توابع، تخصیص متغیرها، فراخوانی روشهای اشیاء، کنترل جریان یک برنامه، و سایر وظایف اساسی آشنا است. در عوض، هدف آن کمک به کاربران پایتون است که یاد بگیرند از پشته علم داده پایتون – کتابخانههایی مانند موارد ذکر شده در بخش زیر و ابزارهای مرتبط – برای ذخیره، دستکاری و به دست آوردن بینش موثر از دادهها استفاده کنند.
چرا پایتون؟
پایتون در چند دهه گذشته به عنوان یک ابزار درجه یک برای کارهای محاسباتی علمی، از جمله تجزیه و تحلیل و تجسم مجموعه دادههای بزرگ، ظهور کرده است. این ممکن است برای طرفداران اولیه زبان پایتون تعجب آور باشد: خود این زبان به طور خاص با تجزیه و تحلیل دادهها یا محاسبات علمی در ذهن طراحی نشده است.
سودمندی پایتون برای علم داده عمدتاً از اکوسیستم بزرگ و فعال بستههای شخص ثالث ناشی میشود: NumPy برای دستکاری دادههای مبتنی بر آرایه همگن، Pandas برای دستکاری دادههای ناهمگن و برچسبگذاری شده، SciPy برای وظایف محاسباتی علمی رایج، Matplotlib برای انتشار. -تجسمهای با کیفیت، IPython برای اجرای تعاملی و به اشتراک گذاری کد، Scikit-Learn برای یادگیری ماشین، و بسیاری از ابزارهای دیگر که در صفحات بعدی به آنها اشاره خواهد شد.
اگر به دنبال راهنمای زبان پایتون هستید، من پروژه خواهر این کتاب را پیشنهاد میکنم، تور گردباد پایتون. این گزارش کوتاه، توری از ویژگیهای ضروری زبان پایتون را ارائه میکند، که هدف آن دانشمندان دادهای است که قبلاً با یک یا چند زبان برنامهنویسی دیگر آشنا هستند.
طرح کلی کتاب Python Data Science Handbook
هر بخش شمارهدار این کتاب بر روی یک بسته یا ابزار خاص تمرکز دارد که به یک بخش اساسی از داستان علم داده پایتون کمک میکند، و به فصلهای کوتاهی تقسیم میشود که هر کدام یک مفهوم واحد را مورد بحث قرار میدهند:
قسمت اول، «Jupyter: Beyond Normal Python» IPython و Jupyter را معرفی میکند. این بستهها محیط محاسباتی را فراهم میکنند که بسیاری از دانشمندان داده که از پایتون استفاده میکنند در آن کار میکنند.
بخش دوم کتاب Python Data Science Handbook، «مقدمهای بر NumPy» بر کتابخانه NumPy تمرکز دارد، که درای را برای ذخیرهسازی کارآمد و دستکاری آرایههای داده متراکم در پایتون فراهم میکند.
قسمت سوم کتاب Python Data Science Handbook، «دستکاری دادهها با Pandas» کتابخانه Pandas را معرفی میکند که DataFrame را برای ذخیرهسازی کارآمد و دستکاری دادههای برچسبدار/ستونی در پایتون فراهم میکند.
قسمت چهارم کتاب Python Data Science Handbook، «تجسم با Matplotlib» بر Matplotlib متمرکز است، کتابخانهای که قابلیتهایی را برای طیف انعطافپذیری از تجسم دادهها در پایتون فراهم میکند.
قسمت پنجم کتاب Python Data Science Handbook، «یادگیری ماشین» بر کتابخانه Scikit-Learn تمرکز دارد که پیادهسازیهای پایتون کارآمد و تمیزی از مهمترین و شناختهشدهترین الگوریتمهای یادگیری ماشین را ارائه میدهد.
دنیای PyData مطمئناً بسیار بزرگتر از این شش بسته است و هر روز در حال رشد است. با در نظر گرفتن این موضوع، من تمام تلاش خود را در سراسر این کتاب انجام میدهم تا به دیگر تلاشها، پروژهها و بستههای جالبی که مرزهای کاری را که میتوان در پایتون انجام داد، اشاره کنم. با این وجود، بستههایی که من روی آنها تمرکز میکنم در حال حاضر برای بسیاری از کارهایی که در فضای علم داده پایتون انجام میشود، اساسی هستند، و من انتظار دارم حتی با ادامه رشد اکوسیستم در اطراف آنها، مهم باقی بمانند.
سرفصلهای کتاب Python Data Science Handbook:
- Preface
- I. Jupyter: Beyond Normal Python
- 1. Getting Started in IPython and Jupyter
- 2. Enhanced Interactive Features
- 3. Debugging and Profiling
- II. Introduction to NumPy
- 4. Understanding Data Types in Python
- 5. The Basics of NumPy Arrays
- 6. Computation on NumPy Arrays: Universal Functions
- 7. Aggregations: min, max, and Everything in Between
- 8. Computation on Arrays: Broadcasting
- 9. Comparisons, Masks, and Boolean Logic
- 10. Fancy Indexing
- 11. Sorting Arrays
- 12. Structured Data: NumPy’s Structured Arrays
- III. Data Manipulation with Pandas
- 13. Introducing Pandas Objects
- 14. Data Indexing and Selection
- 15. Operating on Data in Pandas
- 16. Handling Missing Data
- 17. Hierarchical Indexing
- 18. Combining Datasets: concat and append
- 19. Combining Datasets: merge and join
- 20. Aggregation and Grouping
- 21. Pivot Tables
- 22. Vectorized String Operations
- 23. Working with Time Series
- 24. High-Performance Pandas: eval and query
- IV. Visualization with Matplotlib
- 25. General Matplotlib Tips
- 26. Simple Line Plots
- 27. Simple Scatter Plots
- 28. Density and Contour Plots
- 29. Customizing Plot Legends
- 30. Customizing Colorbars
- 31. Multiple Subplots
- 32. Text and Annotation
- 33. Customizing Ticks
- 34. Customizing Matplotlib: Configurations and Stylesheets
- 35. Three-Dimensional Plotting in Matplotlib
- 36. Visualization with Seaborn
- V. Machine Learning
- 37. What Is Machine Learning?
- 38. Introducing Scikit-Learn
- 39. Hyperparameters and Model Validation
- 40. Feature Engineering
- 41. In Depth: Naive Bayes Classification
- 42. In Depth: Linear Regression
- 43. In Depth: Support Vector Machines
- 44. In Depth: Decision Trees and Random Forests
- 45. In Depth: Principal Component Analysis
- 46. In Depth: Manifold Learning
- 47. In Depth: k-Means Clustering
- 48. In Depth: Gaussian Mixture Models
- 49. In Depth: Kernel Density Estimation
- 50. Application: A Face Detection Pipeline
- Index
جهت دانلود کتاب Python Data Science Handbook میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.