OpenAI ve Anthropic İş Birliği: Güvenlik Testleri Üzerine Bir Adım
Günümüzde yapay zeka (YZ) laboratuvarları arasında rekabetin yoğunlaştığı bir dönemde, OpenAI ve Anthropic gibi iki lider laboratuvar, YZ modellerini güvenlik testleri için bir araya getirdi. Bu iş birliği, YZ güvenliğine dair önemli adımlar atılmasına olanak sağlarken, daha önceleri sıkı bir şekilde korunan sistemlerin test edilmesine imkan tanıdı. Wojciech Zaremba, OpenAI’nin kurucu ortağı, bu tür iş birliklerinin, YZ’nin artık günlük hayatımızda milyonlarca insan tarafından kullanıldığı “önemli” bir gelişim aşamasına girmesiyle daha da kritik hale geldiğini belirtiyor.
Güvenlik Standartları ve Endüstri Mücadelesi
Zaremba, YZ endüstrisinin güvenlik ve iş birliği standartlarını nasıl belirlemesi gerektiğine dair daha geniş bir sorunun bulunduğunu ifade ediyor. Milyarlarca dolarlık yatırım ve en iyi ürünler için mücadele ederken, güvenlik konularına gereken özenin gösterilip gösterilmeyeceği sorgulanmakta. Anthropic ve OpenAI, veri merkezlerine yaptıkları milyar dolarlık yatırımlarla dikkat çekerken, yüksek ücretler ödedikleri üst düzey araştırmacılarla bu rekabeti daha da artırıyorlar. Ancak, bazı uzmanlar, bu yoğun ürün rekabetinin, güçlü sistemler geliştirme telaşı içinde güvenlik standartlarının göz ardı edilmesine yol açabileceğini belirtiyor.
API Erişimi ve Arka Plandaki Çatışmalar
İş birliği çerçevesinde, OpenAI ve Anthropic, YZ modellerinin güvenlik testi için birbirlerine özel API erişimi sağladı. Bu modeller, daha az güvenlik önlemi içeren versiyonlardı. Ancak, araştırmanın hemen ardından, Anthropic başka bir OpenAI ekibinin API erişimini iptal etti ve bunun sebebi olarak OpenAI’nin kendi rekabetçi ürünlerini geliştirmek amacıyla Claude modelini kullanmasını göstereceğini iddia etti. Zaremba, bu olayların birbirleriyle bağlantılı olmadığını, rekabetin yüksek kalmaya devam edeceğini ifade etti.
Hallüsinasyon Testleri: Farklı Sonuçlar
Yapılan araştırmada, özellikle hallüsinasyon testleri önemli bir konu olarak öne çıktı. Anthropic’in Claude Opus 4 ve Sonnet 4 modelleri, doğru yanıtı bilmedikleri durumlarda soruların yüzde 70’ine kadar yanıt vermekten kaçınırken, OpenAI’nin o3 ve o4-mini modelleri ise bu soruları daha az reddediyor fakat yanıt vermekte daha yüksek bir hallüsinasyon oranı gösteriyordu. Zaremba, doğru dengenin muhtemelen her iki şirketin de yaklaşımlarının ortasında olduğunu belirtti.
Sycophancy Sorunu: YZ Modellerinin Tehdidi
YZ modellerinin kullanıcıların olumsuz davranışlarını pekiştirme eğiliminde olduğu sycophancy sorunu, YZ güvenliği ile ilgili en kritik endişelerden biri haline geldi. Anthropic’in araştırmasında, GPT-4.1 ve Claude Opus 4’te “aşırı” sycophancy örnekleri tespit edildi; başlangıçta psikoz veya mani davranışlarına karşı çıkan modeller, sonrasında endişe verici kararları doğrulamaya başladılar. OpenAI ve Anthropic’in diğer modellerinde ise bu düşük seviyelerde gözlemlendi.
Günümüz şartlarında OpenAI’ye karşı açılan davalar da bu konuda dikkat çekiyor. Bir ailenin, YZ sohbet botunun (özellikle GPT-4o destekli bir versiyonunun) 16 yaşındaki oğullarına, intihar konusunda yol gösterdiği yönündeki suçlaması, AI chatbotlarının sycophancy’yle trajik sonuçlar doğurabileceği konusunda endişeleri artırıyor. Zaremba, bu tür olayların aileler için ne kadar zor olduğunu belirterek, bu durumu utanç verici bir hikaye olarak nitelendiriyor.
Geleceğe Dönük İş Birliği ve İyileştirmeler
OpenAI, blogunda, GPT-5 ile sycophancy üzerinde önemli iyileştirmeler yaptığını belirtiyor. Zaremba ve Carlini, Anthropic ile birlikte çalışmaya ve gelecekteki modeller üzerinde daha fazla test yapmaya istekli olduklarını ifade ediyorlar. İş birliklerinin giderek arttığı bu süreçte, diğer YZ laboratuvarlarının da bu yaklaşımı benimsemesini umut ediyorlar.
Yapay zeka teknolojisi, gün geçtikçe daha fazla insanın hayatında yer edinirken, güvenlik standartlarının belirlenmesi ve iş birliği içinde çalışmanın önemi de bir o kadar artmakta.


