Anthropic, bu hafta en yeni modeli Mythos’un kamuya sunumunu kısıtladığını duyurdu. Bunun sebebi, bu modelin dünya genelinde kullanılan yazılımlardaki güvenlik açıklarını bulmadaki yeteneklerinin son derece yüksek olması. Mythos’un geniş bir şekilde yayımlanması yerine, şirket, bu teknolojiyi Amazon Web Services’tan JPMorgan Chase’e kadar kritik çevrimiçi altyapılar üzerinde çalışan büyük şirketler ve organizasyonlarla paylaşmayı tercih ediyor. OpenAI’nin de benzer bir plan üzerinde düşündüğü belirtiliyor. Bu stratejinin arkasındaki temel fikir, büyük işletmelerin, gelişmiş büyük dil modellerini (LLM’ler) kullanarak güvenli yazılımlara sızabilecek kötü niyetli kişilerden önde olmalarını sağlamak.
Ancak, yukarıdaki cümlede geçen “e” kelimesi, bu yayımlama stratejisinin yalnızca siber güvenlik ya da model yeteneklerinin abartılmasından daha fazlası olabileceğine işaret ediyor.
AI siber güvenlik laboratuvarı Irregular’in CEO’su Dan Lahav, Mythos’un piyasaya sürülmeden önce TechCrunch’a, AI araçları tarafından güvenlik açıklarının bulunmasının önemli olduğunu, ancak herhangi bir zayıflığın saldırgan için spesifik değerinin birçok faktöre bağlı olduğunu söyledi. Bu faktörlerden biri, bu zayıflıkların nasıl bir araya getirileceği.
Lahav, “Her zaman aklımda olan soru şudur: Bu saldırgan açısından çok anlamlı bir şekilde kullanılabilir bir şey buldular mı, ister bireysel olsun ister bir zincirin parçası olarak?” dedi.
Anthropic, Mythos’un, önceki modeli Opus’tan çok daha fazla zayıflıktan yararlanabildiğini belirtiyor. Ancak Mythos’un gerçekten de siber güvenlik modellerinin son noktası olup olmadığı belirsiz. AI siber güvenlik girişimi Aisle, Mythos’un başardığı birçok şeyi daha küçük, açık ağırlıklı modeller kullanarak çoğaltabildiğini öne sürdü. Aisle ekibi, bu sonuçların tek bir derin öğrenme modelinin siber güvenlik için yeterli olmadığını, bunun yerine belirli bir göreve bağlı olduğunu gösterdiğini savunuyor.
Opus’un daha önce siber güvenlik için devrim niteliğinde bir ürün olarak görülmesi nedeniyle, sınır laboratuvarlarının büyük organizasyonlara sundukları ürünleri kısıtlama nedenlerinden biri daha var: Bu, büyük işletmeler için sözleşmeler oluşturarak pazarda daha fazla etki sağlarken, rakiplerin modellerini distilasyon tekniğiyle kopyalamasını zorlaştırıyor. Distilasyon, sınır modellerini kullanarak yeni LLM’leri daha düşük maliyetle eğitme yöntemidir.
Exe.dev’in CEO’su yazılım mühendisi David Crawshaw, sosyal medya paylaşımında bu durumu şöyle özetledi: “Bu, üst düzey modellerin artık kurumsal anlaşmalarla sınırlandırıldığı ve artık küçük laboratuvarlar tarafından distile edilemediği gerçeğinin pazarlama kaplamasıdır. Mythos’u kullanabilmemiz için, o zamana kadar yalnızca işletmelere ait yeni bir üst düzey versiyon çıkmış olacaktır. Bu döngü, işletme dolarlarının akışını sürdürmekte yardımcı oluyor.”
Bu analiz, AI ekosisteminde gördüğümüz bir durumu yansıtıyor: En büyük, en yetenekli modelleri geliştiren sınır laboratuvarları ile Aisle gibi çoklu modellerden yararlanan ve genellikle distilasyon yoluyla geliştirilmiş açık kaynak LLM’leri ekonomik avantaj olarak gören şirketler arasında bir yarış var.
Sınır laboratuvarları, bu yıl distilasyon konusunda daha sert bir tutum takınmış durumda. Anthropic, kamuya açtığı açıklamalarda Çinli firmaların modellerini kopyalama çabalarından söz ederken, üç önde gelen laboratuvar olan Anthropic, Google ve OpenAI, distilasyonları tanımlamak ve engellemek için bir araya geldi. Distilasyon, büyük sermaye kullanarak sağlanan avantajları ortadan kaldırdığından, bu tür bir yaklaşımı engellemek, önceden değerli bir çaba haline geliyor. Buna ek olarak, seçici yayımlama, laboratuvarların kurumsal tekliflerini farklılaştırmalarına olanak tanıyor.
Mythos’un veya herhangi bir yeni modelin internetin güvenliğini gerçekten tehdit edip etmeyeceği zamanla görülecek. Ancak, teknolojinin dikkatli bir şekilde sunulması, bir sorumluluk olarak kabul ediliyor.
Anthropic, bu kararla ilgili olarak distilasyon endişeleri hakkında yanıt vermedi, ancak şirket belki de interneti ve kendi kazancını korumanın akıllıca bir yolunu buldu.

