
همانطور که امیدوارم همه بدانیم، اون چیزه متدها و مناسک نیستند. بلکه در کهکشانهای همسایه یعنی مایندست و ویژن میچرخه!
زالاندو اخیراً گزارشی منتشر کرده که نشان میدهد چگونه آنها توانستهاند پستمورتمهایشان (اگر هنوز در سیاره اسکرام هستید، آن را به عنوان جلسات و اکشنهای رترو در نظر بگیرید!)، که به عنوان گزارشهای دروس آموخته از شکستها در نظر گرفته میشوند (و امید است در جایی مانند یک صفحه وب در کانفلوئنس شرکت نوشته شوند) و تیمها پس از بحث و تصمیمگیری در مورد آنها هرگز کاری در راستای حل آن مسائل انجام نداده را به منبع قدرتمندی از بینش استراتژیک تبدیل کنند.
معمولا دروس آموخته به صورت یک پستمورتم (خیلی سخته این کلمه رو به فارسی ترجمه کرد!) نوشته و در جایی تلنبار میشده و تجزیه و تحلیل آنها به صورت دستی خیلی دشوار بود. در اینجا لحظهای است که این روزها ناگهان ایدهای به ذهن گونه انسانها میرسد:
چه میشد اگر دیتای مربوط به هر کدام از این کاتآفها و خرابیها بتواند کل سیستم ما را هوشمندتر کند؟
این پرسشی بود که تیم SRE زالاندو در مورد حجم زیاد دادههای مربوط به خرابیهای زیرساختهایشان از خودشان پرسیدند و برای پاسخ به آن، آنها یک پایپلاین هوشمند چندمرحلهای (بازم کلمه فارسی کم اومد!) با استفاده از مدلهای زبانی بزرگ (LLMs) ساختند. این سیستم به طور خودکار هزاران مورد از موارد پس از وقوع را خلاصه کرد، تکنولوژیها و زیرساختهای مربوطه (مانند AWS S3، DynamoDB یا Postgres) را بررسی و شناسایی کرد، دلایل ریشهای را تجزیه و تحلیل کرد و الگوهای خرابی بین سیستمی را آشکار نمود. کاری که زمانی هفتهها تلاش انسانی را میطلبید، اکنون میتوانست در عرض چند ساعت به بینشهای عملی تبدیل شود.
نتایج قابل توجه بود: هوش مصنوعی نقاط دردناک دائمی - از پیکربندیهای نادرست و مسائل مربوط به مقیاسبندی گرفته تا حتی مدیریت ضعیف تغییرات - را کشف و به شرکت کمک کرد تا با هدر دادن کمتر سرمایههای زمانی و پولی راهی برای جلوگیری از تکرار حوادث مشابه در آینده بیابد. اگرچه زالاندو تأکید میکند که هوش مصنوعی جایگزین قضاوتها و تصمیمگیریهای انسانی نشده و به عنوان یک انسان امیدوارم که آنها حقیقت را بگویند، اما وقتی به تصویر کلی نگاه میکنیم این مدلهای هوشمند، [دستکم در تشخیص الگوی خرابی] به اندازه بسیار زیادی به مشاوران فنی و مهندسان کمک کردهاند. این مربوط به بررسیها در مقیاس بزرگ و در عین حال ارزیابی دقت، عملکرد، قابلیت اطمینان، قابلیت نگهداری و نظایر آنهاست.
من هرگز توسط زالاندو استخدام نشدهام و هیچکس هم برای تبلیغ کردن آنها به من پول نمیدهد. اما فقط نمونهای از نسل بعدی پدیده چابکی را در گزارشی از یک وبلاگ فناوری دیدم و تصمیم گرفتم آن را با دوستان و همراهانم به اشتراک بگذارم. برای خرید لباس و کفش ورزشی، هنوز هم شخصا شرکتهای کوچک و متوسط محلی را ترجیح میدهم، زیرا آنها هنوز انسانگراتر هستند!
اما همانطور که قبلاً میلیونها بار بحث کردیم و گفتیم:
چابکی (اون چیزه!) یعنی پیدا کردن کاری که باید انجام شود!