TechCrunch tarafından görülen şirket içi yazışmalara göre, Google’ın Gemini yapay zekasını geliştirmek için çalışan yükleniciler, yanıtlarını Anthropic’in rakip modeli Claude tarafından üretilen çıktılarla karşılaştırıyor.
TechCrunch yorum almak için ulaştığında Google, Gemini’ye karşı yapılan testlerde Claude kullanımı için izin alıp almadığını söylemedi.
Teknoloji şirketleri daha iyi yapay zeka modelleri oluşturmak için yarıştıkça, bu modellerin performansı genellikle rakiplere karşı değerlendirilir; yüklenicilerin rakiplerinin yapay zeka yanıtlarını titizlikle değerlendirmesini sağlamak yerine, genellikle kendi modellerini sektör karşılaştırmaları aracılığıyla çalıştırarak değerlendirilir.
Modelin çıktılarının doğruluğunu derecelendirmekle görevlendirilen Gemini üzerinde çalışan yüklenicilerin, gördükleri her yanıtı doğruluk ve ayrıntı gibi birden fazla kritere göre puanlaması gerekiyor. TechCrunch tarafından görülen yazışmalara göre yüklenicilere kimin cevabının daha iyi olduğunu (Gemini’nin mi yoksa Claude’un mu) belirlemeleri için soru başına 30 dakikaya kadar süre veriliyor.
Yazışmalara göre yükleniciler, Gemini’yi diğer isimsiz yapay zeka modelleriyle karşılaştırmak için kullandıkları dahili Google platformunda Anthropic’in Claude’una ilişkin referansların yakın zamanda göründüğünü fark etmeye başladılar. TechCrunch tarafından görülen Gemini yüklenicilerine sunulan çıktılardan en az birinde açıkça şunlar belirtiliyordu: “Ben Anthropic tarafından yaratılan Claude’um.”
Dahili bir sohbet, müteahhitlerin Claude’un yanıtlarının güvenliği Gemini’den daha fazla vurguladığını fark ettiklerini gösterdi. Bir yüklenici, “Claude’un güvenlik ayarlarının yapay zeka modelleri arasında en katı olanı” olduğunu yazdı. Bazı durumlarda Claude, farklı bir yapay zeka asistanının rolünü oynamak gibi güvenli olmadığını düşündüğü yönlendirmelere yanıt vermiyordu. Bir diğerinde Claude bir soruya yanıt vermekten kaçınırken Gemini’nin yanıtı “çıplaklık ve esaret”i de içerdiği için “büyük bir güvenlik ihlali” olarak işaretlendi.
Antropik ticari hizmet şartları Anthropic’in onayı olmadan müşterilerin “rakip bir ürün veya hizmet oluşturmak” veya “rakip yapay zeka modellerini eğitmek” için Claude’a erişmelerini yasaklayın. Google, Anthropic’in önemli bir yatırımcısıdır.
Gemini’yi çalıştıran Google DeepMind’in sözcüsü Shira McNamara, TechCrunch tarafından sorulduğunda Google’ın Claude’a erişim için Anthropic’ten onay alıp almadığını söylemedi. Yayınlanmadan önce ulaşıldığında, Antropik bir sözcü basın zamanında yorum yapmadı.
McNamara, DeepMind’ın değerlendirmeler için “model çıktılarını karşılaştırdığını” ancak Gemini’yi Antropik modeller konusunda eğitmediğini söyledi.
McNamara, “Elbette standart endüstri uygulamalarına uygun olarak bazı durumlarda değerlendirme sürecimizin bir parçası olarak model çıktılarını karşılaştırıyoruz” dedi. “Ancak İkizler burcunu eğitmek için Antropik modelleri kullandığımıza dair herhangi bir öneri yanlıştır.”
Geçtiğimiz hafta TechCrunch, şirketin yapay zeka ürünleri üzerinde çalışan Google yüklenicilerinin artık Gemini’nin uzmanlıkları dışındaki alanlardaki yapay zeka yanıtlarını derecelendirmelerinin istendiğini özel olarak bildirdi. Dahili yazışmalar, yüklenicilerin Gemini’nin sağlık gibi son derece hassas konularda yanlış bilgi üretebileceğine dair endişelerini dile getirdi.
+1 628-282-2811 numaralı telefondan Signal üzerinden bu muhabire güvenli bir şekilde ipuçları gönderebilirsiniz.
TechCrunch’ın yapay zeka odaklı bir haber bülteni var! Buradan kaydolun Her Çarşamba gelen kutunuza almak için.

