کتاب DevOps for Data Science (دوآپس برای علوم داده) مفاهیم مربوط به علوم داده برای دوآپس در رایانش ابری را در سه قسمت مختلف شرح میدهد.
در ادامه مقدمهای از کتاب DevOps for Data Science را از زبان نویسنده شرح خواهیم داد.
مقدمهای بر کتاب DevOps for Data Science:
علم داده به تنهایی بسیار بیفایده است.
اگر به خود زحمت میدهید کتابی در زمینه علم داده بردارید، احتمالاً عاشق نوشتن کدهای زیبای پایتون یا R هستید. یا شاید شما علاقه زیادی به تجسم دادههای زیبا دارید. یا شاید از تنظیم مدلهای یادگیری ماشین لذت ببرید. در نهایت – ناامیدکننده – این چیزها مهم نیستند.
مهم این است که آیا کار شما مفید است یا خیر. به این معنا که آیا بر تصمیمات سازمان شما تأثیر میگذارد یا در جهان گستردهتر. این بدان معناست که شما باید کار خود را با قرار دادن آن در تولید به اشتراک بگذارید.
بسیاری از دانشمندان داده در تولید به عنوان یک حالت عجیب و غریب فکر میکنند که در آن ابررایانهها مدلهای پیشرفته یادگیری ماشینی را بر روی دهها قطعه داده اجرا میکنند، هر یک ترابایت. یک کوه مه آلود در پسزمینه وجود دارد، و هیچ صفحه Google Sheet، فایل CSV، یا پرسوجو پایگاه داده نیمهپخت در چشم نیست.
اما این یک افسانه است. اگر شما یک دانشمند داده هستید که کار خود را در مقابل چشمان دیگری قرار میدهید، در حال تولید هستید. و، من معتقدم، اگر در حال تولید هستید، کتاب DevOps for Data Science برای شماست.
ممکن است منطقی بپرسید که من کیستم که چنین اعلامیهای بکنم.
در سال ۲۰۱۹، نقش رهبری یک تیم علم داده را ترک کردم تا به تیم مهندسی راه حلها در Posit (در آن زمان RStudio) بپیوندم. تیم مهندسی Solutions به مشتریان کمک میکند تا محصولات حرفهای Posit را استقرار، نصب، پیکربندی و استفاده کنند.
به این ترتیب، من با صدها سازمانی که علم داده را در تولید مدیریت میکنند، در مورد معنای تولید برای آنها صحبت کردهام. من به آنها کمک کردهام تا سیستمهای خود را برای توسعه و به اشتراکگذاری محصولات علم داده با ابزارهای منبع باز و محصولات حرفهای Posit قویتر کنند.
من سازمانها را در هر سطحی از بلوغ علم داده دیدهام. برای برخی از سازمانها، در تولید به معنای گزارشی است که رندر وایمیل میشود. برای دیگران، این به معنای میزبانی یک برنامه یا داشبوردی زنده است که مردم از آن بازدید میکنند. برای پیچیدهترین، به معنای ارائه پیشبینیهای زنده به سرویس دیگری از یک مدل یادگیری ماشینی از طریق یک رابط برنامهنویسی کاربردی (API) است.
صرف نظر از بلوغ یا شکل، هر سازمانی میخواهد بداند که کار قابل اعتماد است، محیط ایمن است و زمانی که مردم به آن نیاز داشته باشند محصول در دسترس خواهد بود.
و این چیزی است که کتاب DevOps for Data Science در مورد آن است – همه چیزهایی که علم داده نیستند که برای استقرار یک محصول علم داده در تولید لازم است.
خبر خوب این است که هنر قبلی موجود است. DevOps محصولی از مهندسی نرمافزار است که در درجه اول به این مشکلات مربوط میشود و ما به عنوان دانشمندان داده میتوانیم درسهای مهمی را بیاموزیم.
در حین تعامل با بسیاری از سازمانها، دیدهام که کدام الگوها مسیر تولید را برای دانشمندان دادهای چرب میکنند و کدامیک تمایل دارند آن را مختل کنند.
هدف من این است که کتاب DevOps for Data Science به شما کمک میکند پروژههای علم داده بسازید که پیادهسازی آنها آسانتر و سادهتر باشد و دانش و مهارتهای لازم برای تولید آنها را در زمانی که زمانش فرا رسید، داشته باشید.
بدین منظور کتاب DevOps for Data Science به سه بخش تقسیم شده است.
بخش ۱ در مورد اعمال بهترین شیوههای DevOps در زمینه علم داده است. پایبندی به این بهترین شیوهها، تولید پروژهها را آسانتر میکند و امنیت و ثبات آنها را پس از رسیدن به آنها تضمین میکند. در حالی که این بهترین شیوهها از DevOps الهام گرفته شدهاند، پروژههای علم داده و علم داده به اندازه کافی با مهندسی نرمافزار همه منظوره متفاوت هستند که نیاز به تفکر مجدد دارد.
بخش ۲ کتاب DevOps for Data Science مروری بر مفاهیم اساسی در مدیریت فناوری اطلاعات است که شما را به نقطهای میرساند که بتوانید یک محیط علوم داده پایه را میزبانی و مدیریت کنید. اگر یک سرگرمی هستید یا فقط یک تیم کوچک علم داده دارید، ممکن است بتوانید بدون پشتیبانی IT/Admin کار کنید. حتی اگر در سازمانی با پشتیبانی قابل توجه IT/Admin کار میکنید، شما را با واژگان صحبت با IT/Admins در سازمان خود و برخی مهارتهای اساسی در مورد اینکه چگونه خودتان وظایف IT/Admin را انجام دهید، مجهز میکند.
قسمت ۳ درباره این است که چگونه همه چیزهایی که در قسمت ۲ آموختهاید در سازمانهایی که در مقیاس سازمانی فعالیت میکنند ناکافی است. اگر قسمت ۲ نحوه انجام وظایف IT/Admin را خودتان توضیح میدهد، قسمت ۳ تلاش من برای توضیح این است که چرا نباید این کار را انجام دهید.
سرفصلهای کتاب DevOps for Data Science:
- Cover
- Half Title
- Series Page
- Title Page
- Copyright Page
- Table of contents
- Welcome!
- Introduction
- I. DevOps Lessons for Data Science
- 1. Environments as Code
- 2. Data Project Architecture
- 3. Databases and Data APIs
- 4. Logging and Monitoring
- 5. Deployments and Code Promotion
- 6. Demystifying Docker
- II. IT/Admin for Data Science
- 7. The Cloud
- 8. The Command Line
- 9. Linux Administration
- 10. Application Administration
- 11. Server Resources and Scaling
- 12. Computer Networks
- 13. Domains and DNS
- 14. SSL/TLS and HTTPS
- III. Enterprise-Grade Data Science
- 15. Enterprise Networking
- 16. Auth in Enterprise
- 17. Compute at Enterprise Scale
- 18. Package Management in the Enterprise
- IV. Appendices
- A. Technical Detail: Auth Technologies
- B. Technical Detail: Load Balancers
- C. Lab Map
- D. Cheat Sheets
- Index
جهت دانلود کتاب DevOps for Data Science میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.