Milyonlarca Windows makinesinin çökertildiği 78 dakikanın ayrıntıları
Cuma sabahı, dünya çapında teknoloji dünyasını sarsan bir olay yaşandı. New York'ta gece yarısından kısa bir süre sonra başlayan ve hızla yayılan bir çöküş dalgası, milyonlarca Windows makinesini etkiledi. Avustralya'da alışveriş yapanlardan İngiltere'de yayın yapan Sky News'e, Hong Kong ve Hindistan'daki havaalanı check-in masalarına kadar birçok yerde Mavi Ekran Ölümü (BSOD) mesajları belirdi. Peki, kesinti neyden kaynaklandı? İşte detaylar...
İlk saatlerde belirsizlik hakimdi
The Verge'ye göre; kesintinin ilk saatlerinde, ne olduğu konusunda büyük bir belirsizlik hakimdi. Avustralyalı siber güvenlik uzmanı Troy Hunt, sosyal medyada "Şu anda çok garip bir şey oluyor" diye yazdı. Reddit'te, BT yöneticileri, "En son CrowdStrike güncellemesinde BSOD hatası" başlıklı bir konu açarak durumu tartışmaya başladılar.
Sorunlar, ABD'deki büyük havayollarının filolarını yere indirmesine ve Avrupa'daki bankalar, hastaneler ve diğer büyük kurumlarda çalışanların sistemlerine giriş yapamamasına yol açtı. Kısa sürede, bu felaketin sadece küçük bir dosyadan kaynaklandığı ortaya çıktı.
19 Temmuz 12:09'da ET'de, siber güvenlik şirketi CrowdStrike, Falcon güvenlik yazılımına hatalı bir güncelleme yayınladı. Bu yazılım, kötü amaçlı yazılım, fidye yazılımı ve diğer siber tehditlere karşı koruma sağlamak amacıyla geniş çapta kullanılıyor. Ancak bu güncelleme, beklenmedik şekilde büyük bir çöküşe neden oldu.
CrowdStrike'ın güncellemesi, diğer birçok güncelleme gibi, otomatik olarak web üzerinden dağıtılan küçük bir dosya (sadece 40KB) idi. Ancak bu kez, yazılımın çekirdek düzeyinde çalışması, sorunların bu kadar yaygın ve ciddi olmasına yol açtı.
CrowdStrike'ın Falcon yazılımı, Windows'un çekirdek düzeyinde çalışarak işletim sisteminin sistem belleğine ve donanımına sınırsız erişim sağlıyor. Bu, yazılımı bir savunma hattı olarak çok daha yetenekli hale getiriyor, ancak aynı zamanda büyük sorunlara yol açma potansiyeli taşıyor. DoubleYou CEO'su Patrick Wardle, bu durumu "Çekirdekte çalışıyorsanız ve geçersiz belleğe erişmeye çalışırsanız, bir hataya neden olacak ve bu da sistemin çökmesine neden olacaktır" diyerek açıklıyor.
CrowdStrike, hatayı fark ettikten sonra orijinal güncellemeden 78 dakika sonra bir düzeltme yayınladı. Ancak, birçok destek çalışanı için düzeltme, etkilenen makineleri manuel olarak ziyaret etmeyi ve hatalı içerik güncellemesini silmeyi içeriyordu.
CrowdStrike olayına ilişkin soruşturmalar devam ederken, sürücüde uzun süredir hareketsiz duran bir hatanın bu duruma yol açmış olabileceği düşünülüyor. Patrick Wardle, "Sürücü muhtemelen ek hata denetimi yapacak şekilde güncellenmeli" diyerek gelecekte benzer sorunların önlenmesi için önerilerde bulunuyor. Ayrıca, güncellemelerin kademeli olarak yayınlanmasının, büyük sorunların tüm kullanıcı tabanına ulaşmadan önce tespit edilmesine olanak tanıyabileceği belirtiliyor.
Cuma günkü felakete Microsoft neden olmadı, ancak Windows'un çalışma şekli tüm işletim sisteminin çökmesine izin verdi. CrowdStrike'ın bu hatalı güncellemesi, teknoloji dünyasında büyük yankı uyandırdı ve gelecekte benzer durumların nasıl önleneceği konusunda önemli sorular ortaya koydu. Bu olay, güvenlik yazılımlarının ne kadar kritik olduğunu ve bu tür yazılımların güncellemelerinin ne kadar dikkatle yönetilmesi gerektiğini bir kez daha gözler önüne serdi.