Giriş
Teknolojinin hızla değiştiği günümüzde, yazılımlar ve otomasyon çözümleri, işletmelerin verimliliğini arttırma potansiyeli taşırken, aynı zamanda dikkat edilmesi gereken bazı riskleri de beraberinde getiriyor. Son zamanlarda yaşanan bir olay, sunucu sistemleri ve veri merkezi yönetiminde yapay zeka (YZ) temelli bir aracın yanlış kullanımının nasıl felakete dönüşebileceğini gözler önüne serdi. Bu olay, Yüksek Performans hedefleyen IT yöneticileri için önemli dersler barındırıyor.
Olayın Arka Planı
Alexey Grigorev, AI Shipping Labs adındaki web sitesini AWS (Amazon Web Services) altyapısına taşırken, Claude Code adlı otomasyon aracını kullandı. Ancak Claude, yanlış yönetildiği için veritabanındaki yıllarca süren kayıtları silme hatası yaptı. Grigorev, Claude’dan iki ayrı kurulumun maliyetini düşürmek için tek bir yapı kullanmasını istedi; fakat Claude bu isteği yerine getirirken gerekli state dosyasını dikkate almadı. Bu durum, veri merkezi yapılandırmasında kritik hatalara neden oldu.
Teknik Özellikler ve Süreç
Grigorev, Terraform adında bir altyapı yönetim aracı kullanarak web sitesinin altyapısını oluşturmayı planladı. Terraform, sunucu sistemleri dahil olmak üzere ağ, yük dengelemesi ve veritabanı gibi tüm bileşenleri oluşturmak için güçlü bir araç. Ancak, gerekli durum dosyasının yüklenmemesi, duplicate (kopya) kaynakların oluşmasına yol açtı. Claude, bu kaynakları temizlemek için harekete geçti; ancak aracı durdurmayı unutarak, hatalı bir yapılandırma oluşturdu. Sonuç olarak, veri merkezi verileri silinerek geri dönüşü olmayan bir hata yaşandı.
Yaşanan Sorunlar ve Çözüm Arayışları
Grigorev, tesisini oluştururken gerekli önlemleri almadığı için büyük kayıplar yaşadı. Silinen veritabanında 2.5 yıllık kayıtlar ve yedekleme dosyaları bulunuyordu. Amazon’un destek ekibi sayesinde veriler bir gün içerisinde kurtarıldı; ancak bu durum Grigorev’e, ”soğutma çözümleri” ve koruma cihazlarının nasıl çalıştığı hakkında önemli dersler öğretti.
Gelecek İçin Önlemler
Olay sonrasında Grigorev, benzer hatalardan kaçınmak için bir dizi önlem almayı planladı. Bunlar arasında, veritabanı yedekleme sürecini test etme, Terraform ve AWS izinlerine silme korumaları ekleme ve state dosyasını yerel makineden S3 depolama alanına taşıma gibi adımlar yer alıyor. Ayrıca, YZ aracı Claude’nun komut çalıştırma yetkisini kısıtlayarak, riskleri yönetmek için manuel denetim yapma kararı aldı.
Sonuç
Dijital dönüşüm sürecinde yüksek performans hedefleyen IT yöneticileri için bu olay, önemli bir ders niteliği taşıyor. Otomasyon çözümleri kullanılırken, denetim ve güvenlik önlemlerinin ihmal edilmemesi gerekmektedir. Sunucu sistemleri ve veri merkezi yönetimi, doğru yapılandırma ve bilgi güvenliği ile güçlendirilmeli; aksi takdirde, teknoloji parmaklarımızın ucunda kaybolabilir.
Kaynak: Tom’s Hardware verileriyle derlenmiştir.


