حادثه CrowdStrike که در 19 جولای 2024 رخ داد، یکی از بزرگترین اختلالات فناوری اطلاعات در تاریخ بود. این رویداد که توسط یک بهروزرسانی نرمافزاری معیوب ایجاد شد، باعث هرجومرج گستردهای شد و میلیونها سیستم را در سراسر جهان تحت تأثیر قرارداد. در این مقاله، جزئیات آنچه اتفاق افتاد، دلایل وقوع آن، میزان تأثیر و راهحلهای پیشنهادی برای جلوگیری از وقوع مجدد چنین حوادثی را بررسی خواهیم کرد.
در 19 جولای 2024، حدود ساعت 04:09 UTC، CrowdStrike، یک شرکت پیشرو درزمینهٔ امنیت سایبری، یک بهروزرسانی پیکربندی برای نرمافزار امنیتی Falcon خود منتشر کرد. این بهروزرسانی که برای بهبود قابلیتهای نرمافزار طراحیشده بود، بهطور ناخواسته باعث یک خرابی فاجعهبار شد. این بهروزرسانی باعث شد که کامپیوترهای ویندوزی تحت تأثیر، وارد حالت بوت لوپ یا حالت بازیابی بوت شوند و غیرقابل استفاده شوند.
این مشکل ابتدا در ماشینهای مجازی در حال اجرا بر روی Microsoft Azure و Google Compute Engine مشاهده شد. این پلتفرمها تقریباً بلافاصله پس از انتشار بهروزرسانی، گزارشهایی از خرابیها و راهاندازی مجدد گسترده دریافت کردند. مشکل محدود به این محیطها نبود؛ بهسرعت به ماشینهای فیزیکی و سایر پلتفرمهای ابری نیز گسترش یافت و صنایع و خدمات مختلفی را تحت تأثیر قرارداد.
علت اصلی حادثه یک نقص در Falcon Sensor بود که یک جزء حیاتی از مجموعه امنیتی CrowdStrike است. Falcon Sensor در سطح کرنل سیستمعامل عمل میکند و ادغام عمیقی با سیستم دارد و حفاظت جامعی در برابر تهدیدات ارائه میدهد. با این حال، این ادغام عمیق نیز به این معنی است که هرگونه مشکل در Sensor میتواند عواقب جدی داشته باشد.
بهروزرسانی معیوب یک خطای پیکربندی را معرفی کرد که باعث شد Falcon Sensor برخی از حالتهای سیستم را بهعنوان تهدید تفسیر کند. این تفسیر نادرست باعث شد که سنسور یک سری اقدامات را آغاز کند که درنهایت باعث خرابی سیستم شد. بهطور خاص، سنسور یک سری رویدادها را تحریک کرد که منجر به ورود سیستمعامل به حالت بوت لوپ یا حالت بازیابی بوت شد.
سیستمهای تحت تأثیر عمدتاً شامل سیستمهای ویندوز 10 و ویندوز 11 بودند، اگرچه برخی از سیستمهای ویندوز 7 و ویندوز 8 نیز تحت تأثیر قرار گرفتند. بهطور قابلتوجهی، سیستمهای در حال اجرای macOS و Linux تحت تأثیر قرار نگرفتند، زیرا بهروزرسانی پیکربندی Falcon Sensor مخصوص محیطهای ویندوزی بود.
مقیاس تأثیر بیسابقه بود. حدود 8.5 میلیون کامپیوتر در سراسر جهان تحت تأثیر بهروزرسانی معیوب قرار گرفتند. این حادثه خدمات حیاتی در بخشهای مختلف ازجمله خطوط هوایی، بانکها، بیمارستانها، بازارهای سهام و خدمات دولتی را مختل کرد.
خطوط هوایی و فرودگاهها ازجمله بخشهایی بودند که بیشترین آسیب را دیدند. این حادثه باعث اختلالات قابلتوجهی در عملیات پرواز شد و بسیاری از پروازها تأخیر یا لغو شدند. سیستمهای فرودگاهی، ازجمله سیستمهای حملونقل بار و چک این، غیرقابل استفاده شدند و باعث هرجومرج و سردرگمی برای مسافران شدند.
بانکها و مؤسسات مالی نیز با اختلالات شدید مواجه شدند. بسیاری از دستگاههای خودپرداز و خدمات بانکی آنلاین در دسترس نبودند و باعث ناراحتی مشتریان و احتمالاً خسارات مالی شدند. بازارهای سهام با تأخیرها و وقفههایی در معاملات مواجه شدند که تأثیر مالی را بیشتر کرد.
بیمارستانها و ارائهدهندگان خدمات بهداشتی نیز از این حادثه مصون نماندند. سیستمهای حیاتی مورداستفاده برای مراقبت از بیماران، پروندههای پزشکی و تجهیزات تشخیصی تحت تأثیر قرار گرفتند و خطراتی برای ایمنی و ارائه خدمات به بیماران ایجاد کردند.
خدمات دولتی، ازجمله خدمات اضطراری و وبسایتهای عمومی، با قطعیها و اختلالات مواجه شدند. این امر توانایی دولتها را در ارائه خدمات ضروری و ارتباط با عموم مردم در طول بحران مختل کرد.
پاسخ CrowdStrike به این حادثه سریع بود. در عرض چند ساعت پس از شناسایی مشکل، شرکت یک اصلاحیه برای رفع بهروزرسانی معیوب منتشر کرد. با این حال، فرآیند بازیابی ساده نبود. بسیاری از سیستمهای تحت تأثیر نیاز به مداخله دستی برای بازیابی عملکرد داشتند که منجر به قطعیهای طولانیتر برای برخی از خدمات شد.
مدیرعامل CrowdStrike، جورج کورتز، عذرخواهی عمومی کرد و به مشتریان اطمینان داد که شرکت بهطور خستگیناپذیر برای حل مشکل و جلوگیری از وقوع مجدد آن تلاش میکند. شرکت همچنین با مایکروسافت و سایر شرکای صنعتی همکاری کرد تا پشتیبانی فنی و راهنمایی به مشتریان تحت تأثیر ارائه دهد.
این حادثه نتیجه یک حمله سایبری نبود، بلکه یک نقص نرمافزاری بود. علت اصلی یک خطای پیکربندی در بهروزرسانی Falcon Sensor بود. این خطا در مرحله آزمایش شناسایی نشد و نشاندهنده شکافهایی در فرآیند تضمین کیفیت بود.
چندین عامل به وقوع این حادثه کمک کردند:
برای جلوگیری از وقوع مجدد حوادث مشابه، چندین اقدام میتوان انجام داد:
حادثه CrowdStrike در 19 ژوئیه 2024، یادآور خطرات و چالشهای احتمالی مرتبط با بهروزرسانی نرمافزار و امنیت سایبری است. درحالیکه این حادثه باعث اختلالات و خسارات مالی قابلتوجهی شد، اهمیت تست، نظارت و مکانیسمهای واکنش قوی را نیز برجسته کرد.
با اجرای راهکارهای پیشنهادی و درس گرفتن از این حادثه، سازمانها میتوانند تابآوری خود را افزایش داده و احتمال وقوع حوادث مشابه را در آینده کاهش دهند. نکته کلیدی اتخاذ یک رویکرد پیشگیرانه و مشارکتی برای امنیت سایبری است که اطمینان حاصل شود که سیستمها ایمن، قابلاعتماد و قادر به مقاومت در برابر پیچیدگیهای چشمانداز دیجیتال مدرن هستند.