کتاب Python Data Science Handbook

جزئیات بیشتر و خرید محصول:

۲۷,۰۰۰ تومان

توضیحات

کتاب Python Data Science Handbook (راهنمای علوم داده پایتون: ابزارهای ضروری برای کار با داده‌ها، ویرایش دوم) یک منبع کامل و کاربردی برای یادگیری زبان برنامه‌نویسی پایتون جهت به کارگیری در علوم داده است. این کتاب در 50 فصل به صورت مفصل ابزارهای پایتون را شرح داده و کار با آن‌ها را در علم داده شرح خواهد داد.

در ادامه مقدمه‌ای از کتاب Python Data Science Handbook را از زبان نویسنده شرح خواهیم داد.

مقدمه‌ای بر کتاب Python Data Science Handbook:

در تدریس خود هم در دانشگاه واشنگتن و هم در کنفرانس‌ها و جلسات مختلف با محوریت فناوری، یکی از رایج ترین سؤالاتی که شنیده‌ام این است: “چگونه باید پایتون را یاد بگیرم؟” افرادی که سؤال می‌کنند عموماً دانش‌آموزان، توسعه‌دهندگان یا محققین فنی هستند که اغلب دارای پیشینه قوی در نوشتن کد و استفاده از ابزارهای محاسباتی و عددی هستند.

اکثر این افراد به خودی خود نمی‌خواهند پایتون را یاد بگیرند، بلکه می‌خواهند این زبان را با هدف استفاده از آن به عنوان ابزاری برای علوم محاسباتی و داده فشرده یاد بگیرند. در حالی که مجموعه بزرگی از ویدیوها، پست‌های وبلاگ و آموزش‌ها برای این مخاطبان به صورت آنلاین در دسترس است، مدت‌هاست که از نبود یک پاسخ خوب واحد برای این سؤال ناامید شده‌ام. این چیزی است که الهام بخش این کتاب است.

کتاب Python Data Science Handbook قرار نیست مقدمه ای برای پایتون یا به طور کلی برنامه نویسی باشد. من فرض می‌کنم خواننده با زبان پایتون، از جمله تعریف توابع، تخصیص متغیرها، فراخوانی روش‌های اشیاء، کنترل جریان یک برنامه، و سایر وظایف اساسی آشنا است. در عوض، هدف آن کمک به کاربران پایتون است که یاد بگیرند از پشته علم داده پایتون – کتابخانه‌هایی مانند موارد ذکر شده در بخش زیر و ابزارهای مرتبط – برای ذخیره، دستکاری و به دست آوردن بینش موثر از داده‌ها استفاده کنند.

چرا پایتون؟

پایتون در چند دهه گذشته به عنوان یک ابزار درجه یک برای کارهای محاسباتی علمی، از جمله تجزیه و تحلیل و تجسم مجموعه داده‌های بزرگ، ظهور کرده است. این ممکن است برای طرفداران اولیه زبان پایتون تعجب آور باشد: خود این زبان به طور خاص با تجزیه و تحلیل داده‌ها یا محاسبات علمی در ذهن طراحی نشده است.

سودمندی پایتون برای علم داده عمدتاً از اکوسیستم بزرگ و فعال بسته‌های شخص ثالث ناشی می‌شود: NumPy برای دستکاری داده‌های مبتنی بر آرایه همگن، پانداها برای دستکاری داده‌های ناهمگن و برچسب‌گذاری شده، SciPy برای وظایف محاسباتی علمی رایج، Matplotlib برای انتشار. -تجسم‌های با کیفیت، IPython برای اجرای تعاملی و به اشتراک گذاری کد، Scikit-Learn برای یادگیری ماشین، و بسیاری از ابزارهای دیگر که در صفحات بعدی به آنها اشاره خواهد شد.

اگر به دنبال راهنمای زبان پایتون هستید، من پروژه خواهر این کتاب را پیشنهاد می‌کنم، تور گردباد پایتون. این گزارش کوتاه، توری از ویژگی‌های ضروری زبان پایتون را ارائه می‌کند، که هدف آن دانشمندان داده‌ای است که قبلاً با یک یا چند زبان برنامه‌نویسی دیگر آشنا هستند.

طرح کلی کتاب Python Data Science Handbook

هر بخش شماره‌دار این کتاب بر روی یک بسته یا ابزار خاص تمرکز دارد که به یک بخش اساسی از داستان علم داده پایتون کمک می‌کند، و به فصل‌های کوتاهی تقسیم می‌شود که هر کدام یک مفهوم واحد را مورد بحث قرار می‌دهند:

قسمت اول، «Jupyter: Beyond Normal Python» IPython و Jupyter را معرفی می‌کند. این بسته‌ها محیط محاسباتی را فراهم می‌کنند که بسیاری از دانشمندان داده که از پایتون استفاده می‌کنند در آن کار می‌کنند.

بخش 1 کتاب Python Data Science Handbook ویرایش دوم

بخش دوم کتاب Python Data Science Handbook، «مقدمه‌ای بر NumPy» بر کتابخانه NumPy تمرکز دارد، که درای را برای ذخیره‌سازی کارآمد و دستکاری آرایه‌های داده متراکم در پایتون فراهم می‌کند.

بخش 2 کتاب Python Data Science Handbook ویرایش دوم

قسمت سوم کتاب Python Data Science Handbook، «دستکاری داده‌ها با پانداها» کتابخانه پانداها را معرفی می‌کند که DataFrame را برای ذخیره‌سازی کارآمد و دستکاری داده‌های برچسب‌دار/ستونی در پایتون فراهم می‌کند.

بخش 3 کتاب Python Data Science Handbook ویرایش دوم

قسمت چهارم کتاب Python Data Science Handbook، «تجسم با Matplotlib» بر Matplotlib متمرکز است، کتابخانه‌ای که قابلیت‌هایی را برای طیف انعطاف‌پذیری از تجسم داده‌ها در پایتون فراهم می‌کند.

بخش 4 کتاب Python Data Science Handbook ویرایش دوم

قسمت پنجم کتاب Python Data Science Handbook، «یادگیری ماشین» بر کتابخانه Scikit-Learn تمرکز دارد که پیاده‌سازی‌های پایتون کارآمد و تمیزی از مهم‌ترین و شناخته‌شده‌ترین الگوریتم‌های یادگیری ماشین را ارائه می‌دهد.

بخش 5 کتاب Python Data Science Handbook ویرایش دوم

دنیای PyData مطمئناً بسیار بزرگتر از این شش بسته است و هر روز در حال رشد است. با در نظر گرفتن این موضوع، من تمام تلاش خود را در سراسر این کتاب انجام می‌دهم تا به دیگر تلاش‌ها، پروژه‌ها و بسته‌های جالبی که مرزهای کاری را که می‌توان در پایتون انجام داد، اشاره کنم. با این وجود، بسته‌هایی که من روی آنها تمرکز می‌کنم در حال حاضر برای بسیاری از کارهایی که در فضای علم داده پایتون انجام می‌شود، اساسی هستند، و من انتظار دارم حتی با ادامه رشد اکوسیستم در اطراف آنها، مهم باقی بمانند.

سرفصل‌های کتاب Python Data Science Handbook:

  • Preface
  • I. Jupyter: Beyond Normal Python
    • 1. Getting Started in IPython and Jupyter
    • 2. Enhanced Interactive Features
    • 3. Debugging and Profiling
  • II. Introduction to NumPy
    • 4. Understanding Data Types in Python
    • 5. The Basics of NumPy Arrays
    • 6. Computation on NumPy Arrays: Universal Functions
    • 7. Aggregations: min, max, and Everything in Between
    • 8. Computation on Arrays: Broadcasting
    • 9. Comparisons, Masks, and Boolean Logic
    • 10. Fancy Indexing
    • 11. Sorting Arrays
    • 12. Structured Data: NumPy’s Structured Arrays
  • III. Data Manipulation with Pandas
    • 13. Introducing Pandas Objects
    • 14. Data Indexing and Selection
    • 15. Operating on Data in Pandas
    • 16. Handling Missing Data
    • 17. Hierarchical Indexing
    • 18. Combining Datasets: concat and append
    • 19. Combining Datasets: merge and join
    • 20. Aggregation and Grouping
    • 21. Pivot Tables
    • 22. Vectorized String Operations
    • 23. Working with Time Series
    • 24. High-Performance Pandas: eval and query
  • IV. Visualization with Matplotlib
    • 25. General Matplotlib Tips
    • 26. Simple Line Plots
    • 27. Simple Scatter Plots
    • 28. Density and Contour Plots
    • 29. Customizing Plot Legends
    • 30. Customizing Colorbars
    • 31. Multiple Subplots
    • 32. Text and Annotation
    • 33. Customizing Ticks
    • 34. Customizing Matplotlib: Configurations and Stylesheets
    • 35. Three-Dimensional Plotting in Matplotlib
    • 36. Visualization with Seaborn
  • V. Machine Learning
    • 37. What Is Machine Learning?
    • 38. Introducing Scikit-Learn
    • 39. Hyperparameters and Model Validation
    • 40. Feature Engineering
    • 41. In Depth: Naive Bayes Classification
    • 42. In Depth: Linear Regression
    • 43. In Depth: Support Vector Machines
    • 44. In Depth: Decision Trees and Random Forests
    • 45. In Depth: Principal Component Analysis
    • 46. In Depth: Manifold Learning
    • 47. In Depth: k-Means Clustering
    • 48. In Depth: Gaussian Mixture Models
    • 49. In Depth: Kernel Density Estimation
    • 50. Application: A Face Detection Pipeline
  • Index

جهت دانلود کتاب Python Data Science Handbook می‌توانید پس از پرداخت، دریافت کنید.

توضیحات تکمیلی

فرمت کتاب

PDF

ویرایش

Second

ISBN

978-1-098-12122-8

تعداد صفحات

550

انتشارات

O'Reilly

سال انتشار

حجم

نویسنده

هیچ دیدگاهی برای این محصول نوشته نشده است.

اشتراک‌گذاری:

دیگر محصولات:

نماد اعتبار ما:

آدرس: اصفهان، فلکه ارتش

 

پشتیبانی از ساعت 18 تا 22: 09392868101

© کليه حقوق محصولات و محتوای اين سایت متعلق به مدیر سایت می‌باشد و هر گونه کپی‌برداری از محتوا و محصولات سایت پیگرد قانونی دارد.