
Google’ın üretken yapay zeka sohbet robotu Gemini’nin bazı iç değerlendirme politikalarının, daha az doğru yanıtları garantiledi. İddiaya göre Google, yüklenicilerin (modeli değerlendiren kişiler) Gemini’nin kalifiye olmadıkları konulardaki yanıtlarını derecelendirmesini sağlıyor.
Yapay zekalı bir sohbet robotunun eğitimi oldukça karmaşık bir süreçtir. Bu sadece yapay zeka modelinin veritabanına veri eklemekle ilgili değil. Aslında verilerin yapay zekanın kullanabilmesi için uygun organizasyon yapısı gibi belirli parametreleri karşılaması gerekiyor. Yanlış yanıtların mümkün olduğunca az olmasını sağlamak için oluşturulan yanıtların kalitesini değerlendiren yüzlerce, hatta binlerce kişi var.
Ancak gelen bir rapor TechCrunch Google’ın Gemini yanıtlarını derecelendirme politikaları konusunda ihtiyaç duyduğu tüm çabayı göstermediğini iddia ediyor. Daha önce yüklenicilerin, bir yanıtın doğruluğunu doğrulamak için gerekli niteliklere sahip olmaması durumunda bir yanıtı atlama seçeneğine sahip olduğu bildirilmişti. Artık, bildirildiğine göre Google, doğrulamak için gerekli bilgiye sahip olmasalar bile yanıtları atlamalarına izin vermiyor. Google, tamamı kendi yetkinlikleri dışında olsa bile, kullanıcıların istemin anladıkları kısmını derecelendirmelerini zorunlu kılmaktadır. Ayrıca alanda yeterli uzmanlığa sahip olmadıklarını belirten bir not bırakmaları gerekmektedir. Bildirildiğine göre, yüklenicilerin bir yanıtı atlamalarına izin verildiğinde de istisnalar vardır; önemli bilgilerin eksik olması ve yanıtın anlaşılmaz hale gelmesi durumunda. Ayrıca, potansiyel olarak zararlı içerik oluşturulduğunda da bu istisna geçerlidir.
Elbette bazı kişiler iddia edilen yeni politikalar ve Gemini’nin doğruluğu konusunda endişe duyabilir. İnsanların sağlık konusunda tavsiye almak için İkizler’e başvurması özellikle endişe verici olabilir.
Şu an için Google’dan konuyla ilgili bir açıklama yok. Şirketin doğruluğu sağlamak için diğer politikalarda da ince ayar yapmış olması her zaman mümkündür.
Kişisel olarak üretken yapay zekanın, sağlık tavsiyeleri konusunda ona güvenmeden önce gelişmesi gereken çok daha fazla şey olduğunu görüyorum. Şu ana kadar ChatGPT ve Microsoft’un Copilot’u da dahil olmak üzere farklı modeller kullandım ve teknolojiyi sevmeme rağmen yine de ona %100 güvenmem, özellikle de sağlık soruları gibi önemli konular söz konusu olduğunda.

