Anthropic, güçlü siber güvenlik modeli Mythos’un sınırlı halka açık versiyonu olan Fable’ı Salı günü tanıttı.
Ancak, birçok kişi getirilen kısıtlamalardan memnun değil. Siber güvenlik araştırmacıları ve profesyoneller, çevrimiçi platformlarda şikayetlerini dile getiriyorlar.
IBM X-Force’da çalışan tanınmış güvenlik araştırmacısı Valentina “Chompie” Palmiotti, “Fable, siber güvenlikle dolaylı olarak ilgili olabilecek her talebi reddediyor. Blog yazısı okumak gibi masum görevler bile kabul edilmiyor,” şeklinde bir açıklamada bulundu.
Bir istemin güvenlik önlemlerini tetiklemesi durumunda, Fable sohbeti durduruyor ve “güvenlik önlemleri bu mesajı siber güvenlik veya biyoloji konuları için işaretledi” diyor.
Bu güvenlik önlemleri, Fable’ın kötü amaçlı yazılımlar geliştirmek veya yazılımları tehlikeye atmak için kullanılabilme riskini azaltmak amacıyla uygulanmıştır. Benzer bir endişe biyolojik silahların geliştirilmesine karşı da bulunmaktadır.
Mythos, Nisan ayında tanıtıldığında, sınırlı sayıdaki şirket ve kuruluşla paylaşılmıştı. Bu çerçevede, kritik yazılım ve altyapıyı güvence altına almak amacıyla yapılmış bir proje olan Project Glasswing kapsamında kullanılmaktaydı. Geçtiğimiz hafta, Anthropic, Mythos’un erişimini 15 ülkedeki yüzlerce kuruluşa genişletti.
İyi niyetlere rağmen, birçok siber güvenlik uzmanı kısıtlamaların düzensiz doğasından rahatsız. Siber güvenlik uzmanı Matt Suiche, “Eğer ona güvenli kod yazması için sorarsanız, siber güvenlik ile ilgili bir iş olarak değerlendiriyor ve yazılım mühendisliği en iyi uygulamalarından ziyade daha düşük bir performans sergiliyor,” dedi. Fable, bir güvenlik önlemi tetiklendiğinde Claude Opus 4.8 sürümüne geri dönüyor. “Görünüşe göre anahtar kelimelere dayalı, bu nedenle ‘siber güvenlik’ ile ilgili her şey güvenlik önlemlerini tetikliyor,” şeklinde ekledi.
Bize Ulaşın
Hack’lerin AI kullanımı ile ilgili daha fazla bilginiz var mı? Yoksa siber güvenlik şirketlerinin AI kullanımına dair? Düşüncelerinizi duymaktan memnuniyet duyarız. Çalışmadığınız bir cihaz ve ağ üzerinden, Lorenzo Franceschi-Bicchierai’ye güvenli bir şekilde +1 917 257 1382 numarasından Signal üzerinden, Telegram ve Keybase’de @lorenzofb üzerinden ya da e-posta ile ulaşabilirsiniz.
“Ancak bu anlaşılır bir durum, çünkü henüz erken günlerdeyiz ve hâlâ güvenlik önlemlerini ayarlıyorlar. Zamanla gelişeceklerine eminim,” dedi Suiche. “Böyle bir sürüm gerçekleştirdiğinizde, olabildiğince insanı yakalamak daha iyidir ve zamanla güvenlik önlemlerini gevşetmek gerekir.”
Başka bir araştırmacı, “Kod incelemesi bile istemek, Fable’ın güvenlik önlemlerini tetikliyor,” şikayetinde bulundu.
Anthropic, yorum talebine hemen yanıt vermedi.
Model içindeki güvenlik önlemlerinin yanı sıra, Anthropic, siber güvenlik profesyonellerinin Siber Doğrulama Programı‘na başvurmalarını talep ediyor. Onaylandıkları takdirde, başvuranların Claude’ı siber güvenlik çalışmaları için kullanırken daha az sınırlama ile karşılaşmaları sağlanıyor. OpenAI’nın da benzer bir programı bulunuyor: Güvenilir Erişim.
Güvenlik önlemleriyle ilgili düşünceleriniz neler?

