کتاب Data Science Solutions with Python یا راهکارهای علوم داده با پایتون یک منبع بسیار مناسب برای یادگیری مباحث علوم داده با زبان برنامهنویسی پایتون میباشد. این کتاب در 10 فصل به شما آموزش استفاده از پایتون برای به کارگیری آن در چالشهای علم داده را میدهد.
در ادامه مقدمهای از کتاب Data Science Solutions with Python را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Data Science Solutions with Python:
این کتاب چارچوب محاسباتی خوشهای توزیع شده به نام PySpark، پلتفرمهای چارچوب یادگیری ماشینی به نام Scikit-Learn, PySpark MLlib, H2O و XGBoost و چارچوب یادگیری عمیق به نام Keras را پوشش میدهد. پس از مطالعه این کتاب، میتوانید از یادگیری نظارت شده و بدون نظارت برای حل مسائل دادههای عملی و واقعی استفاده کنید. در این کتاب، نحوه مهندسی ویژگیها، بهینهسازیهای پرپارامترها، آموزش و آزمایش مدلها، توسعه خطوط لوله و خودکارسازی فرآیند یادگیری ماشین را خواهید آموخت.
برای شروع، این کتاب به دقت مدلهای ML و DL تحت نظارت و بدون نظارت را ارائه میکند و چارچوبهای کلان داده و چارچوبهای یادگیری ماشین و یادگیری عمیق را بررسی میکند. همچنین در مورد مدل پارامتری به نام مدل خطی تعمیم یافته و یک مدل رگرسیون بقا که به عنوان مدل مخاطرات متناسب کاکس و زمان شکست شتاب (AFT) شناخته میشود، بحث میکند. این یک مدل طبقهبندی باینری به نام رگرسیون لجستیک و یک مدل مجموعهای به نام درختان تقویت گرادیان را ارائه میدهد.
همچنین DL و یک شبکه عصبی مصنوعی، طبقهبندیکننده پرسپترون چندلایه (MLP) را معرفی میکند. روشی را برای انجام تحلیل خوشهای با استفاده از مدل k-means توصیف میکند. تکنیکهای کاهش ابعاد مانند تجزیه و تحلیل مؤلفههای اصلی و تحلیل تشخیصی خطی را بررسی میکند و با باز کردن بستهبندی یادگیری ماشین خودکار به پایان میرسد.
این کتاب دانشمندان دادههای متوسط و مهندسین یادگیری ماشین را هدف قرار میدهد که میخواهند یاد بگیرند که چگونه چارچوبهای کلان دادههای کلیدی و همچنین چارچوبهای ML و DL را اعمال کنند. قبل از کاوش در مطالب کتاب Data Science Solutions with Python، مطمئن شوید که آمار اولیه، برنامهنویسی پایتون، تئوریهای احتمالات و تحلیلهای پیشبینی را میدانید. این کتاب از Anaconda (توزیع منبع باز برنامهنویسی پایتون) برای مثال استفاده میکند.
لیست زیر برخی از کتابخانههای پایتون را که این کتاب پوشش میدهد را برجسته میکند:
- Pandas برای ساختارهای داده و ابزار.
- PySpark برای محاسبات در حافظه، خوشه.
- XGBoost برای تقویت گرادیان و تجزیه و تحلیل رگرسیون بقا.
- Auto-Sklearn، ابزار بهینهسازی خط لوله مبتنی بر درخت (TPOT)، Hyperopt-Sklearn و H2O برای AutoML.
- Scikit-Learn برای ساخت و اعتبارسنجی الگوریتمهای کلیدی یادگیری ماشین.
- Keras برای چارچوبهای سطح بالا برای یادگیری عمیق.
- H2O برای یادگیری ماشین بدون راننده.
- خطوط حیاتی برای تجزیه و تحلیل بقا.
- NumPy برای آرایهها و ماتریسها.
- SciPy برای انتگرال ها، حل معادلات دیفرانسیل و بهینهسازی.
- Matplotlib و Seaborn برای نمودارها و نمودارهای شناخته شده.
همچنین شما میتوانید برای یادگیری تخصصی PySpark از کتاب Advanced Analytics with PySpark نیز استفاده نمائید.
سرفصلهای کتاب Data Science Solutions with Python:
- About the Author
- About the Technical Reviewer
- Acknowledgments
- Introduction
- Chapter 1: Exploring Machine Learning
- Chapter 2: Big Data, Machine Learning, and Deep Learning Frameworks
- Chapter 3: Linear Modeling with Scikit-Learn, PySpark, and H2O
- Chapter 4: Survival Analysis with PySpark and Lifelines
- Chapter 5: Nonlinear Modeling With Scikit-Learn, PySpark, and H2O
- Chapter 6: Tree Modeling and Gradient Boosting with Scikit-Learn, XGBoost, PySpark, and H2O
- Chapter 7: Neural Networks with Scikit-Learn, Keras, and H2O
- hapter 8: Cluster Analysis with Scikit-Learn, PySpark, and H2O
- Chapter 9: Principal Component Analysis with Scikit-Learn, PySpark, and H2O
- Chapter 10: Automating the Machine Learning Process with H2O
- Index
فایل کتاب Data Science Solutions with Python را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.