کتاب Hands-on Site Reliability Engineering یک کتاب غنی و کامل از مسائل نظارت و مشکلیابی سایتها و فناوریهای ابری است. این کتاب برای افراد علاقهمند که ممکن است در حین کار خود با سرویسهای ابری و نظارت بر آنها با مشکلی گریبانگیر شوند بسیار کارآمد است. همچنین این کتاب در 12 فصل انواع ابزارهای متن باز برای کار در حوزهی رایانش ابری، کار با API و KPI ها، آشنایی با مفهوم SRE و بسیاری از مفاهیم و نکات ناب و ریز رایانش ابری را با زبانی شیوا و دقیق بیان میکند. در ادامه مقدمهای از کتاب Hands-on Site Reliability Engineering را از زبان خود نویسندهی کتاب شرح خواهیم داد.
مقدمهای بر کتاب Hands-on Site Reliability Engineering:
در این دنیای پرسرعت کنونی، تغییر تنها ثابت است. ما در مرحلهای هستیم که مردم در حال حاضر قادرند به شبکههای پرسرعت از طریق دستگاههای مختلف در هر کجا که باشند با استفاده از LAN مستقیم، WiFi یا داده تلفن همراه دسترسی پیدا کنند. این امر به مشاغل اجازه میدهد خدمات دیجیتالی را در مقیاس وسیع ارائه دهند.
فناوری حمایتی از این مشاغل به طور مداوم در حال تکامل است تا مدل کسب و کار در حال تغییر را با سرویسهای خرد و معماریهای کوچک، DevOps، زیرساختهای ابری با استفاده از رویکردهای ابر چند منطقهای و ترکیبی، دادههای بزرگ، یادگیری ماشین و اینترنت اشیاء ارائه دهد. همهگیری کووید -19 باعث تحول بیشتر دیجیتالی سازمانها در سراسر جهان شده است. ما حتی شاهد این هستیم که مدارس در حال آموزش دانشآموزان در مورد نرمافزارهای ویدئو کنفرانس هستند.
با تغییر این چشمانداز، یک کسب و کار میتواند انتظار داشته باشد که در مقیاس دریافت میلیونها درخواست در روز رشد کند. این درخواستها میتواند از جغرافیای مختلف و در اکثر ساعات روز انجام شود. در چنین مقیاسی، اجرای قابل اطمینان برنامهها نیاز به ساعت است.
در حال حاضر برای بسیاری از مشاغل، موفقیت آنها بستگی زیادی به قابلیت اطمینان خدمات دیجیتالی آنها دارد که به آنها امکان میدهد در مقیاس وسیع فعالیت کنند. یک مشتری ناراضی میتواند به سرعت به پیشنهاد رقبا روی آورد. بنابراین، یادگیری تکنیکها و ابزارهای جدیدی که برای مطابقت با ماهیت پویای مشاغل امروزی و اجرای برنامههای قابل اعتماد وجود دارد، ضروری شده است.
کتاب Hands-on Site Reliability Engineering توضیح میدهد که چگونه می توان از مفاهیم و شیوههای مهندسی قابلیت اطمینان سایت برای ساخت و اجرای برنامههای بسیار قابل اعتماد استفاده کرد. خوشحالیم که این فرصت را داشتیم که این کتاب را در زمان مناسب هنگامی که تعدادی از سازمانها به سمت مهندسی قابلیت اطمینان سایت حرکت میکنند، بنویسیم. این کتاب به شما کمک میکند تا سفر SRE را برای افراد و سازمانهای مختلف آغاز کنید.
این کتاب با معرفی چگونگی ساختار یک سازمان فناوری اطلاعات و مفاهیم اساسی که باید توسط یک متخصص فناوری اطلاعات درک شود، آغاز میشود. این امر زمینه را برای ایجاد این یادگیری برای خوانندگانی که در صنعت فناوری اطلاعات تازه کار هستند فراهم میکند تا مفاهیم اساسی را درک کنند. کتاب Hands-on Site Reliability Engineering همچنین به عنوان تجدیدی برای متخصصان مجرب عمل میکند.
سپس کتاب، مفاهیم و اقدامات اساسی DevOps و SRE را معرفی میکند.
در نیمه دوم کتاب Hands-on Site Reliability Engineering، خوانندگان را با مفاهیم و شیوههای پیشرفته SRE آشنا میکنیم.
در سراسر کتاب، نمونههای مربوطه، نمونه کد و معرفی برخی از ابزارها در زمینههای خاص SRE وجود دارد.
دو نکته مهم در کتاب Hands-on Site Reliability Engineering وجود دارد. اینها به شرح زیر است:
- توضیحی در مورد همه اصطلاحات مربوط به SRE که در کتاب ذکر شده است و زمینه مناسب برای درک خواننده از ارتباط آنها با SRE.
- نمونههای کاربردی برای کمک به خوانندگان برای درک و پیادهسازی SRE در دنیای واقعی.
در طول 12 فصل کتاب Hands-on Site Reliability Engineering، موارد زیر را خواهید آموخت:
فصل 1 خوانندگان را با نقش فناوری اطلاعات در یک سازمان، ساختار درون بخش فناوری اطلاعات و تیمهای مختلف درون آنها آشنا میکند. این فصل همچنین پروتکل TCP/IP و سیستم نام دامنه (DNS) را معرفی میکند.
فصل 2 DevOps، اصول و شیوههای DevOps و نمای کلی ابزارهای CI/CD را معرفی میکند.
فصل 3 مهندسی قابلیت اطمینان سایت (SRE)، تفاوت DevOps و SRE، شرایط مختلف SRE، مسئولیتهای تیمهای SRE و مجموعه مهارت مهندسان قابلیت اطمینان سایت (SREs) را معرفی میکند.
فصل 4 مفهوم زحمت، سناریوهایی که در آن زحمت را میتوان از طریق اتوماسیون حذف کرد، و نمونههای عملی معرفی میکند.
فصل 5 کتاب Hands-on Site Reliability Engineering، مدیریت انتشار و نمونههای کاربردی از اجرای استقرار آبی-سبز و زرد را در Kubernetes معرفی میکند.
فصل 6 یکی از مسئولیتهای کلیدی تیم SRE که مدیریت حوادث است را توضیح میدهد. این مقاله مفهوم مرگهای بیعیب و نقص و توضیح چرخه زندگی حادثه را با یک مثال زمان واقعی معرفی میکند. این فصل همچنین نقش تیمهای توسعهای را در کار با SRE در حل و فصل حوادث تولید کمتر توضیح میدهد.
فصل 7 توضیحات مفصلی در مورد نظارت بر سیستمهای تولید ارائه میدهد. همچنین نمای کلی از دستههای مختلف ابزارهای نظارتی را با نمونههای کاربردی برخی از ابزارهای منبع باز ارائه میدهد.
فصل 8 توضیحات مفصلی در مورد قابلیت مشاهده ارائه میدهد. مروری کلی بر سه ستون مشاهدهپذیری با نمونههای کاربردی برخی از کتابخانههای منبع باز و ابزارهایی برای ایجاد سیستمهای قابل مشاهده ارائه شده است.
فصل 9 درباره KPI های کلیدی SRE که SLI ،SLO ،SLI و بودجه خطا هستند توضیح میدهد.
فصل 10 کتاب Hands-on Site Reliability Engineering، توضیحات مفصلی در مورد مهندسی آشوب از جمله روند، روزهای بازی و نمونههای عملی تزریق خطا ارائه میدهد. و سپس در نهایت برخی از تکنیکها را برای بهبود قابلیت اطمینان و انعطافپذیری معرفی میکند.
فصل 11 مفاهیم پیشرفته DevSecOps و AIOps را تشریح میکند. یک مثال عملی برای پیادهسازی ChatOps ارائه شده است.
برای مطالعهی بیشتر و تخصصی DevOps و کار با ابزار آن یعنی Ansible میتوانید از کتاب Ansible for DevOps استفاده نمائید.
فصل 12 فرهنگ SRE در سازمانها را شرح میدهد.
سرفصلهای کتاب Hands-on Site Reliability Engineering:
- 1. Understanding the World of IT
- 2. Introduction to DevOps
- 3. Introduction to SRE
- 4. Identify and Eliminate Toil
- 5. Release Management
- 6. Incident Management
- 7. IT Monitoring
- 8. Observability
- 9. Key SRE KPIs: SLAs, SLOs, SLIs, and Error Budgets
- 10. Chaos Engineering
- 11. DevSecOps and AIOps
- 12. Culture of Site Reliability Engineering
- Index
فایل کتاب Hands-on Site Reliability Engineering را میتوانید پس از پرداخت، دریافت کنید.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.