Geçtiğimiz hafta Meta çalışanlarının, bir yapay zeka ajanının vermiş olduğu yanlış teknik tavsiyeler sonucunda iki saat boyunca, hem şirket hem de kullanıcı verilerine yetkisiz erişim sağladığı bildirildi. Meta sözcüsü Tracy Clayton, The Verge‘e yaptığı açıklamada, “Olay sırasında hiçbir kullanıcı verisi kötüye kullanılmadı” şeklinde bilgi verdi.
Bir Meta mühendisi, firma içindeki bir forumda başka bir çalışanın sorduğu teknik bir soruyu analiz etmek için “güvenli bir geliştirme ortamında OpenClaw’a benzer” olarak tanımlanan bir iç yapay zeka ajansı kullanıyordu. Ancak, ajan, analizi tamamladıktan sonra önceden onay almadan bağımsız olarak soruya halk olarak yanıt vermeye de karar verdi. Bu yanıt, sadece soruyu talep eden çalışan için görünmek üzere tasarlanmıştı ve kamuya açık olarak yayınlanmamalıydı.
Bir çalışan, ajanın tavsiyesine uyarak harekete geçti. Ancak bu tavsiye “yanlış bilgi” sağladı ve Meta’nın kullandığı ikinci en yüksek güvenlik seviyesi olan “SEV1” düzeyinde bir güvenlik olayına neden oldu. Olay, çalışanların yetkisiz erişimle hassas verilere ulaşmalarına olanak tanıdı, ancak sorun daha sonra çözüldü.
Clayton’ın belirttiğine göre, olayda yer alan yapay zeka ajansı yalnızca yanlış teknik tavsiyeler vermekle kalmış, başka bir teknik eylem gerçekleştirmemiş. Bir insan, yanıttan önce daha fazla test yaparak ve bilgiyi paylaşmadan önce daha kapsamlı bir değerlendirme yaparak durumu daha iyi yönetebilirdi. Ayrıca, bu soruyu sormuş olan çalışanın yanıtı halka açık olarak paylaşmayı planlayıp planlamadığı da belirsizliğini koruyor.
Clayton, “Sistemi kullanan çalışan, otomatik bir bot ile iletişim kurduğunun tamamen farkındaydı. Bu durum, alt kısımda belirtilen bir açıklama ve çalışanın o dizideki kendi yanıtı ile gösterilmiştir” diye ekledi. “Ajan, sadece bir soruya yanıt vermekten başka bir işlem yapmadı. O tavsiyeye dayalı olarak hareket eden mühendis, eğer daha dikkatli olsaydı veya başka kontroller gerçekleştirseydi, bu durumdan kaçınılabilirdi.”
Geçtiğimiz ay, açık kaynak platformu OpenClaw’dan bir yapay zeka ajansı, bir çalışanın gelen kutusundaki e-postaları düzenlemesi için ona talimat verilmesi sonucunda, izinsiz e-postaları silerek daha doğrudan bir tür isyan gerçekleştirmişti. OpenClaw gibi ajanların temel amacı, kendi başlarına eylem gerçekleştirebilmeleri; ancak diğer yapay zeka modellerinde olduğu gibi, her zaman istekleri ve talimatları doğru bir biçimde yorumlayamadıkları ya da doğru yanıtlar vermedikleri gerçeği, Meta çalışanları tarafından iki kez keşfedilmiş durumda.
Bu tür olayların gelecekte önlenmesi için ne gibi önlemler alınmalı sizce?

