Anthropic, Claude Fable 5’i duyurdu. Şirket, bu yapay zeka modelinin şimdiye kadar sunulan en güçlü versiyon olduğunu belirtirken; biyoloji gibi konulardaki yeteneklerini de övgüyle anlattı. Ancak model, bir lise öğrencisinin bile yanıtlayabileceği basit biyoloji sorularına yanıt vermiyor ve bu tür soruları eski amiral gemisi modeli olan Claude Opus 4.8’e yönlendiriyor.
Bu durumun nedeni, Fable’ın bu tür soruların yanıtlarını bilmemesi değil; Anthropic’in bu sınırlamayı kasıtlı olarak uygulamasıdır.
Fable, halkla ilişkilerde kullanılan bir model olup, Mythos sınıfına aittir. Bu model, siber güvenlik görevlerini yerine getirmede son derece yetenekli olarak tanımlanıyor. Ancak, Fable’ın biyoloji alanındaki sınırlamaları, en belirgin ve kısıtlayıcı olanları olarak öne çıkıyor.
Modeli test ettiğimde, birçok temel biyoloji sorusuna yanıt vermeyi reddetti. “Hücre zarları hakkında bana bilgi ver” veya “mitokondri nedir” gibi sorulara yanıt alamadım. “Prion nedir” veya “mRNA aşıları nasıl çalışır” gibi sorular da yanıtsız kaldı.
“Bu dengeyi müşterilerin modelin yeteneklerinden daha erken faydalanabilmesi için yaptık.”
Sıradan ve nesnel olarak zararsız tıbbi sorulara da sınırlamalar uygulanmış. Fable, “saman nezlesine ne sebep olur” veya “asthma ilacı nasıl çalışır” sorularına da yanıt vermedi. Bazı temel sorularım ise geçebildi; örneğin “kanser nedir” veya “DNA nedir” gibi. Fable, bu tür sorulara yanıt vermediğinde, Opus 4.8 genellikle tatmin edici yanıtlar verdi.
Anthropic, biyoloji filtrelerinin bilinçli bir seçim olduğunu ve sıkı kuralların özellikle biyolojik silahlara yönelik endişeler nedeniyle uygulandığını belirtiyor. Şirketin sözcüsü Paruul Maheshwary, “Claude Fable 5’in lansmanıyla birlikte, modelin gerçek dünyadaki bilimsel görevleri başarma kabiliyetinin arttığına inanıyoruz. Aynı zamanda kötü niyetli aktörlerin bu modelleri yüksek riskli biyolojik araştırmalar için kullanma potansiyeli de mevcut.” dedi.
Anthropic, daha önce güvenlik açısından Fable’ın yanıtlarının sınırlandırılacağı dört temel alanı vurgulamış: kimya, biyoloji, siber güvenlik ve damıtma. Şirket, DeepSeek gibi Çinli rakiplerinin kendi modellerinden “endüstriyel” ölçekte damıtma yaptığını iddia ediyor.
Damıtma işlemini anlamlı bir şekilde test edemesem de, Fable kimya ve siber güvenlik alanındaki sorulara daha istekli yanıtlar verdi. Örneğin, TNT’nin patlayıcı özellikleri hakkında temel bir özet sundu. Ancak sentez talimatlarını “bariz nedenlerden” dolayı vermedi. Ayrıca, klor gazının kimyasal silah olarak kullanımı, yaygın parola tehditleri ve nükleer füzyon ile fisyon hakkında yanıtlar verdi. Ancak sarin gazı hakkında sorduğumda yine Opus’a yöneltti.
“Bu dengeyi, müşterilerin modelin yeteneklerinden daha erken faydalanabilmesi için yaptık,” diyen Maheshwary, Anthropic’in tespitlerini geliştirip yanlış olumlu durumları azaltmak için yoğun bir şekilde çalıştığını ekledi. “Mythos sınıfı modelleri, bu tür sınırlandırmalar olmadan biyoloji ve yaşam bilimleri topluluğuna sunmak istiyoruz. Bu sayede bu yetenekler, biyomedikal araştırmalar ve ilaç keşfini hızlandırmak için kullanılabilir.”
Anthropic, bu tür sınırlı bir yayınlamanın gelecekteki modeller için yeni norm haline gelip gelmeyeceği hakkında herhangi bir soruya yanıt vermedi.


