توسعه فرهنگ Google SRE در کسب و کار
پیش گفتار
در طول دوره فعالیت تخصصی، هیچ گاه یادگیری خود را متوقف نکرده ام و همیشه در حال یادگیری در موضوعات مرتبط با رشته تخصصی خود بوده ام. ضعف بزرگی وجود داشت که به دلیل کمبود وقت، هیچگاه اقدام به مستند سازی و انتشار دانش و تجربههای خود نکرده بودم و صرفا در جلسات به اشتراک دانش میپرداختم.
گاهی اوقات مباحثی را مطالعه میکردم که هیچ منبع فارسی زبانی در مورد آن وجود نداشت و یا کامل نبودند و بعد از مدتی متوجه این موضوع گردیدم که افراد بیشتری به یادگیری آن مباحث نیاز دارند. از این رو تصمیم گرفته شد که در حد توان به مستند سازی مباحث جدید پرداخته که اولین نتیجهی آن کتاب پیش روی شما است. در این کتاب تلاش شده است مباحث با بیانی ساده و روان ارائه گردد و در پانویس برخی از صفحات، کلمات انگلیسی مرتبط با یک کلمه فارسی، برای درک بهتر موضوع درج شده است.
این کتاب، نتیجهی یادگیری بنده از دوره ی Developing a Google SRE Culture است و تمامی سرفصل ها و موضوعات مرتبط را پوشش میدهد و سعی شده است که همه مطالب را به بهترین شکل ممکن با تصاویر اصلی منتقل کند و در نهایت برای بهبود کسب و کار شما مورد استفاده قرار گیرد.
مقدمه
آیا تا به حال در مورد قابلیت اطمینان سرویس های خود نگرانی داشته اید ؟ آیا تا به حال شاهد کاهش در تعامل با مشتری بوده اید، اما وقتی از تیم خود سوال میکنید، آنها نمیتوانند توضیح دهند که چرا این اتفاق میافتد؟ هر دو تیم توسعه و عملیات شما میگویند: "همه چیز سبز است." اما میدانید، باید مشکلی وجود داشته باشد زیرا کاربران نهایی شما، مشتریان شما، این را به شما میگویند. اگر زمان قابل توجهی را صرف تولید و اجرای نرمافزارها کردهاید، احتمالاً هنگام بهروزرسانیهای جزئی، تاثیر منفی بر مشتریان را نیز احساس کردهاید. اگر این موقعیت ها برای شما آشنا به نظر میرسد، احتمالاً تعجب میکنید که چرا تیم های توسعه و عملیات شما اغلب اولویت های متناقضی دارند و چرا در لاک خود به کار خود ادامه میدهند. گوگل سال ها صرف اجرای سیستم ها در مقیاس عظیم کرده است. با گذشت زمان، ما شیوههای خود را استاندارد کردهایم تا سرعت ویژگیهایمان را با ریسک قابل اطمینان، هم برای ما و هم برای مشتریانمان متعادل کنیم. این شیوهها، همراه با فرهنگی برای حمایت از آنها، مهندسی قابلیت اطمینان سایت یا SRE مینامیم. چه هنوز در حال تصمیم گیری در مورد چگونگی و زمان انتقال به Cloud هستید، یا قبلاً از فناوری Cloud استفاده میکنید، این مبحث میتواند به شما کمک کند تا درک کنید که چگونه اصول عملی و فرهنگی SRE میتوانند تاثیر مثبت دائمی بر روی پروژه های IT و کار روزانه شما داشته باشند. شما همچنین خواهید آموخت که چگونه اندازه سازمان و سطح بلوغ برای SRE میتواند بر اجرای این اصول تأثیر بگذارد.
این کتاب به شما یک نمای کلی از اصول فنی و فرهنگی SRE میدهد و توضیح میدهد که کجا و چگونه میتوانید آنها را در سازمان خود اعمال کنید. از آنجایی که اصول SRE با شیوههای فلسفه DevOps همسو هستند، این دوره اصول اولیه DevOps را نیز پوشش میدهد. حتی اگر قبلاً با روشهای DevOps آشنا باشید، خواهید دید که گوگل چگونه فلسفه را تفسیر میکند، بنابراین امیدواریم چیز جدیدی یاد بگیرید. این کتاب دارای چندین هدف آموزشی کلی است. در پایان این دوره، میتوانید دیدگاه Google در مورد فلسفه DevOps و رابطه بین DevOps و SRE را مورد بحث قرار دهید. ارزشی را که SRE میتواند به عملیات IT شما ارائه دهد را درک کنید. اصول فنی و فرهنگی SRE گوگل را بیان کنید. سطح بلوغ سازمان خود را در پذیرش SRE ارزیابی کنید. مشخص کنید که در یک مهندس قابلیت اطمینان سایت به دنبال چه مهارت هایی باشید و چگونه نیروی کار موجود خود را آموزش دهید. و در نهایت، درک کنید که چگونه Google میتواند به شما کمک کند تا SRE را در سازمان خود شروع کنید.
مطلبی دیگر از این انتشارات
درک بهتر SLA/SLO/SLI
مطلبی دیگر از این انتشارات
عیب یابی مشکلات شبکه در Docker با استفاده از کانتینر کمکی.
مطلبی دیگر از این انتشارات
ده اشتباه در پیکربندی NGINX