Bir hacker, popüler bir yapay zeka kodlama aracını kullanarak OpenClaw’ı — “gerçekten işler yapabilen” viral, açık kaynaklı yapay zeka ajanı OpenClaw’ı — her yere yüklemeyi başardı. Bu durum bir yandan eğlenceli bir gösteri olarak değerlendirilse de, diğer yandan otonom yazılımların kullanıcıların bilgisayarlarını kendi adına kullanmasına izin veren daha fazla insanla birlikte gelecekte olabileceklerin bir işaretidir.
Hacker, geliştiriciler arasında popüler olan açık kaynaklı bir yapay zeka kodlama aracı olan Cline’da güvenlik araştırmacısı Adnan Khan tarafından birkaç gün önce bir kanıt konsepti olarak ortaya çıkarılan bir zafiyeti kullanarak fırsat yakaladı. Basitçe ifade etmek gerekirse, Cline’ın çalışma akışı, içerisinde şüpheli komutlar verilebilen Anthropic’in Claude’ını kullanıyordu; bu durum, prompt injection olarak bilinen bir teknikle istenmeyen şeylerin yapılmasına neden olabiliyordu.
Hacker, erişimini kullanarak kullanıcıların bilgisayarlarına yazılım otomatik olarak yüklemek için talimatlar gönderdi. İstenilen her şeyi yükleyebilirdi fakat OpenClaw’ı tercih etti. Neyse ki, ajanlar kurulumdan sonra etkinleştirilmedi, aksi takdirde hikaye çok farklı olabilirdi.
Bu durum, AI ajanlarının bilgisayarlarımız üzerinde kontrol sahibi olduğundaher şeyin ne kadar hızlı bir şekilde karmaşık hale gelebileceğinin bir işareti. İlk bakışta sadece zekice bir oyun olarak görünen bu durum — bir grup, chatbotları şiirle suç işlemeye ikna etti — giderek daha fazla otonom yazılımın olduğu bir dünyada, prompt injection’lar büyük güvenlik riskleri oluşturuyor ve onlara karşı savunma yapmak oldukça zor. Bu gerçeği kabul eden bazı şirketler, AI araçlarının ele geçirildiğinde neler yapabileceğini kısıtlıyor. Örneğin, OpenAI, kullanıcı verilerini paylanmasını engelleyen yeni bir Kilit Modu’nu ChatGPT için yakın zamanda tanıttı.
Açıkça, zafiyetleri özel olarak kontrol eden araştırmacıları göz ardı ederseniz, prompt injection’lara karşı koruma sağlamak daha zor hale gelir. Khan, bulgularını yayımlamadan önce Cline’ı bu zafiyet hakkında haftalarca uyardığını belirtti. Ancak zafiyet, kendisini kamuoyuna duyurduktan sonra yalnızca düzeltildi.

