توسعه فرهنگ Google SRE در کسب و کار


پیش گفتار

در طول دوره فعالیت تخصصی، هیچ گاه یادگیری خود را متوقف نکرده ام و همیشه در حال یادگیری در موضوعات مرتبط با رشته تخصصی خود بوده ام. ضعف بزرگی وجود داشت که به دلیل کمبود وقت،‌ هیچگاه اقدام به مستند سازی و انتشار دانش و تجربه‌های خود نکرده بودم و صرفا در جلسات به اشتراک دانش میپرداختم.

گاهی اوقات مباحثی را مطالعه میکردم که هیچ منبع فارسی زبانی در مورد آن وجود نداشت و یا کامل نبودند و بعد از مدتی متوجه این موضوع گردیدم که افراد بیشتری به یادگیری آن مباحث نیاز دارند. از این رو تصمیم گرفته شد که در حد توان به مستند سازی مباحث جدید پرداخته که اولین نتیجه‌ی آن کتاب پیش روی شما است. در این کتاب تلاش شده است مباحث با بیانی ساده و روان ارائه گردد و در پانویس برخی از صفحات، کلمات انگلیسی مرتبط با یک کلمه فارسی، برای درک بهتر موضوع درج شده است.

این کتاب، نتیجه‌ی یادگیری بنده از دوره ی Developing a Google SRE Culture است و تمامی سرفصل ها و موضوعات مرتبط را پوشش میدهد و سعی شده است که همه مطالب را به بهترین شکل ممکن با تصاویر اصلی منتقل کند و در نهایت برای بهبود کسب و کار شما مورد استفاده قرار گیرد.


مقدمه

آیا تا به حال در مورد قابلیت اطمینان سرویس های خود نگرانی داشته اید ؟ آیا تا به حال شاهد کاهش در تعامل با مشتری بوده اید، اما وقتی از تیم خود سوال میکنید، آنها نمیتوانند توضیح دهند که چرا این اتفاق می‌افتد؟ هر دو تیم توسعه و عملیات شما می‌گویند: "همه چیز سبز است." اما میدانید، باید مشکلی وجود داشته باشد زیرا کاربران نهایی شما، مشتریان شما، این را به شما می‌گویند. اگر زمان قابل توجهی را صرف تولید و اجرای نرم‌افزارها کرده‌اید، احتمالاً هنگام به‌روزرسانی‌های جزئی، تاثیر منفی بر مشتریان را نیز احساس کرده‌اید. اگر این موقعیت ها برای شما آشنا به نظر می‌رسد، احتمالاً تعجب می‌کنید که چرا تیم های توسعه و عملیات شما اغلب اولویت های متناقضی دارند و چرا در لاک خود به کار خود ادامه می‌دهند. گوگل سال ها صرف اجرای سیستم ها در مقیاس عظیم کرده است. با گذشت زمان، ما شیوه‌های خود را استاندارد کرده‌ایم تا سرعت ویژگی‌هایمان را با ریسک قابل اطمینان، هم برای ما و هم برای مشتریانمان متعادل کنیم. این شیوه‌ها، همراه با فرهنگی برای حمایت از آنها، مهندسی قابلیت اطمینان سایت یا SRE می‌نامیم. چه هنوز در حال تصمیم گیری در مورد چگونگی و زمان انتقال به Cloud هستید، یا قبلاً از فناوری Cloud استفاده میکنید، این مبحث میتواند به شما کمک کند تا درک کنید که چگونه اصول عملی و فرهنگی SRE می‌توانند تاثیر مثبت دائمی بر روی پروژه های IT و کار روزانه شما داشته باشند. شما همچنین خواهید آموخت که چگونه اندازه سازمان و سطح بلوغ برای SRE میتواند بر اجرای این اصول تأثیر بگذارد.

این کتاب به شما یک نمای کلی از اصول فنی و فرهنگی SRE میدهد و توضیح می‌دهد که کجا و چگونه می‌توانید آنها را در سازمان خود اعمال کنید. از آنجایی که اصول SRE با شیوه‌های فلسفه DevOps همسو هستند، این دوره اصول اولیه DevOps را نیز پوشش می‌دهد. حتی اگر قبلاً با روش‌های DevOps آشنا باشید، خواهید دید که گوگل چگونه فلسفه را تفسیر می‌کند، بنابراین امیدواریم چیز جدیدی یاد بگیرید. این کتاب دارای چندین هدف آموزشی کلی است. در پایان این دوره، می‌توانید دیدگاه Google در مورد فلسفه DevOps و رابطه بین DevOps و SRE را مورد بحث قرار دهید. ارزشی را که SRE میتواند به عملیات IT شما ارائه دهد را درک کنید. اصول فنی و فرهنگی SRE گوگل را بیان کنید. سطح بلوغ سازمان خود را در پذیرش SRE ارزیابی کنید. مشخص کنید که در یک مهندس قابلیت اطمینان سایت به دنبال چه مهارت هایی باشید و چگونه نیروی کار موجود خود را آموزش دهید. و در نهایت، درک کنید که چگونه Google میتواند به شما کمک کند تا SRE را در سازمان خود شروع کنید.

دانلود کتاب

مخزن کتاب در گیت هاب