کتاب Scaling Python with Dask: From Data Science to Machine Learning (مقیاسگذاری پایتون با Dask: از علم داده تا یادگیری ماشین) با مفاهیم مهم و پیشرفتهی علوم داده با استفاده از Dask در زبان پایتون خواهد پرداخت.
در ادامه مقدمهای از کتاب Scaling Python with Dask را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب Scaling Python with Dask:
ما این کتاب را برای دانشمندان داده و مهندسان دادهای که با پایتون و Pandas آشنا هستند و به دنبال حل مشکلات بزرگتر از آنچه ابزار کنونی آنها اجازه میدهد، نوشتیم. کاربران فعلی PySpark متوجه خواهند شد که برخی از این مطالب با دانش موجود آنها در مورد PySpark همپوشانی دارد، اما ما امیدواریم که آنها همچنان مفید باشند، و نه فقط برای دور شدن از ماشین مجازی جاوا (JVM).
بیشتر بخوانید: کتاب Machine Learning with PySpark
اگر با پایتون آشنایی ندارید، برخی از عناوین عالی O’Reilly عبارتند از Learning Python و Python for Data Analysis. اگر شما و تیمتان بیشتر از زبانهای JVM (مانند جاوا یا اسکالا) استفاده میکنید، در حالی که ما کمی تعصب داریم، توصیه میکنیم Apache Spark را همراه با Learning Spark (O’Reilly) و High Performance Spark بررسی کنید. (اوریلی).
کتاب Scaling Python with Dask در درجه اول بر روی علم داده و وظایف مرتبط متمرکز شده است، زیرا به نظر ما، Dask در آنجا بیش از همه برتری دارد. اگر مشکل کلی تری دارید که به نظر میرسد Dask برای آن کاملاً مناسب نیست، ما (با کمی تعصب مجدد) شما را تشویق میکنیم که Scaling Python with Ray (O’Reilly) را بررسی کنید. تمرکز علم داده
یادداشتی در مورد مسئولیت
همانطور که گفته میشود، با قدرت زیاد، مسئولیت بزرگی نیز به همراه دارد. Dask و ابزارهایی مانند آن شما را قادر میسازد تا دادههای بیشتری را پردازش کرده و مدلهای پیچیده تری بسازید. ضروری است که صرفاً به خاطر جمعآوری دادهها غافل نشوید و از خود بپرسید که آیا گنجاندن یک فیلد جدید در مدل شما ممکن است پیامدهای ناخواستهای در دنیای واقعی داشته باشد.
برای یافتن داستانهایی از مهندسان و دانشمندان داده که بهطور تصادفی مدلها یا ابزارهایی را میسازند که تأثیرات مخربی داشتهاند، مانند افزایش حسابرسی اقلیتها، تبعیضهای جنسیتی، یا چیزهای ظریفتری مانند تعصبات در تعبیه کلمات، لازم نیست خیلی سخت جستجو کنید. (روشی برای نمایش معانی کلمات به عنوان بردار). لطفاً با در نظر گرفتن چنین پیامدهای بالقوه ای از قدرتهای جدید خود استفاده کنید، زیرا هیچ کس نمیخواهد به دلایل اشتباه در یک کتاب درسی قرار گیرد.
سرفصلهای کتاب Scaling Python with Dask:
- Preface
- 1. What Is Dask?
- 2. Getting Started with Dask
- 3. How Dask Works: The Basics
- 4. Dask DataFrame
- 5. Dask’s Collections
- 6. Advanced Task Scheduling: Futures and Friends
- 7. Adding Changeable/Mutable State with Dask Actors
- 8. How to Evaluate Dask’s Components and Libraries
- 9. Migrating Existing Analytic Engineering
- 10. Dask with GPUs and Other Special Resources
- 11. Machine Learning with Dask
- 12. Productionizing Dask: Notebooks, Deployment, Tuning, and Monitoring
- A. Key System Concepts for Dask Users
- B. Scalable DataFrames: A Comparison and Some History
- C. Debugging Dask
- D. Streaming with Streamz and Dask
- Index
- About the Authors
جهت دانلود کتاب Scaling Python with Dask میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.