Cloudflare Çöküşü ve Etkileri
Geçtiğimiz günlerde Cloudflare, geniş çaplı bir hizmet kesintisi yaşadıklarını açıkladı. Bu kesinti, yalnızca birkaç saat sürdü ancak etki alanı oldukça genişti. Cloudflare, meydana gelen sorunun bir güvenlik olayı nedeniyle yaşanmadığını ve bu süreçte hiçbir verinin kaybolmadığını belirtti.
Kesintinin Başlangıcı ve Nedenleri
Sorun, 17:52 UTC civarında, Workers KV (Anahtar-Değer) sisteminin tamamen çevrimdışı hale gelmesiyle başladı. Bu durum, birçok kenar hesaplama ve yapay zeka hizmetinde kapsamlı bir kesintiye neden oldu. Workers KV, Cloudflare’ın sunucusuz hesaplama platformu için kritik bir yapı taşıdır ve birçok hizmetinin düzgün çalışabilmesi için büyük öneme sahiptir.
Cloudflare’ın yaptığı açıklamalara göre, yaşanan kesinti toplamda yaklaşık 2,5 saat sürdü. Kesintinin kök sebebi, Workers KV’nin temel depolama altyapısındaki bir hata olup, bu hata bir üçüncü parti bulut sağlayıcısının yaşadığı sorunlardan kaynaklandı.
Kesintinin Hizmetler Üzerindeki Etkisi
Cloudflare, yaşanan bu olayın her bir hizmet üzerindeki etkilerini detaylı bir şekilde açıkladı:
- Workers KV: Arka plandaki depolama altyapısının kullanılamaması nedeniyle %90,22 oranında bir hata oranı yaşandı.
- Access, WARP, Gateway: Kimlik bazlı kimlik doğrulama, oturum yönetimi ve politika uygulama gibi kritik işlevlerde önemli aksaklıklar meydana geldi. Özellikle WARP, yeni cihazları kaydedemedi.
- Dashboard, Turnstile, Challenges: Kullanıcı girişleri ve CAPTCHA doğrulama işlemleri sırasında yaygın hatalarla karşılaşıldı. Turnstile’daki bir kill switch aktivasyonu nedeniyle token yeniden kullanım riski ortaya çıktı.
- Tarayıcı İzolasyonu ve Tarayıcı Rendere Edilmesi: Access ve Gateway’de yaşanan zincirleme arızalar nedeniyle tarayıcı tabanlı oturumlar başlatılamadı.
- Stream, Images, Pages: Stream yayınları ve anlık görüntü yüklemeleri sıfıra düştü ve sayfa oluşturma işlemleri %100 oranında başarısız oldu.
- Workers AI & AutoRAG: KV’ye bağlılıkları nedeniyle bu hizmetler tamamen devre dışı kaldı.
- Durable Objects, D1, Queues: KV ile aynı depolama katmanına inşa edilmiş olan bu hizmetler, %22’ye kadar hata oranı veya tam olarak kullanılamaz hale geldi.
- Realtime & AI Gateway: Konfigürasyon bilgilerine erişememeleri nedeniyle büyük bir kesinti yaşandı.
- Zaraz & Workers Assets: Açık veya kısmi konfigürasyon yükleme sorunları yaşandı.
- CDN, Workers for Platforms, Workers Builds: Bazı bölgelerde artan gecikmeler ve yeni Worker oluşturma işlemleri tamamen başarısız oldu.
Cloudflare’ın Gelecek Planları
Cloudflare, bu kesintinin ardından tek bir üçüncü parti bulut sağlayıcısına olan bağımlılıklarını azaltmak için bir dizi dayanıklılık artırıcı değişikliği hızlandıracaklarını duyurdu. KV’nin merkezi depolama alanı, Cloudflare’ın kendi R2 nesne depolama sistemine taşınacak. Bu, dışa bağımlılığı azaltmayı hedefliyor.
Ayrıca, Cloudflare’ın çeşitli hizmetlerde kesinti sırasında hizmetlerin yavaşça yeniden başlatılmasını sağlamak için çapraz hizmet güvenlik önlemleri uygulamayı ve yeni araçlar geliştirmeyi planladığı belirtildi. Bu önlemler, depolama kesintileri öncesinde trafik artışlarını kontrol altına alarak sistemlerin yeniden toparlanma sürecinde ikincil arızaların yaşanmasını engellemeyi amaçlıyor.
Sektör Üzerindeki Etkisi
Cloudflare’ın yaşadığı bu kesinti, yalnızca kendi hizmetlerini değil, aynı zamanda başka hizmet sağlayıcıları üzerinde de geniş çapta olumsuz etkiler yarattı. Özellikle Google Cloud Platformu gibi diğer büyük hizmet sağlayıcıları da bu olaydan etkilendi. İşletmeler, günlük işlemlerini yapmak için güvenilir bulut hizmetlerine bağımlı olduklarından, böyle durumlar maliyet ve zaman bakımından ciddi sorunlara yol açabiliyor.
Bu tür kesintilerin sektörde oluşturacağı kaygılar, birçok işletmenin kendi IT altyapısını çeşitlendirmeyi ve dış kaynak kullanımlarını gözden geçirmeyi teşvik edebilir. Bu, bir hizmet sağlayıcısına bağımlılığı azaltarak, işletmelerin daha dayanıklı hale gelmesine yardımcı olabilir.
Sonuç olarak, Cloudflare olayları dizisi, sadece bir teknik sorun olarak kalmamakta; aynı zamanda bulut hizmetleri dünyasında güvenlik, dayanıklılık ve sürdürülebilirlik konularında önemli dersler de içermektedir.


