GenAI’nin bir şeyler uydurmaya yatkın olduğuna dair daha fazla kanıta ihtiyacınız varsa, Google’ın Gemini sohbet robotu (eski adıyla Bard), 2024 Super Bowl’un zaten gerçekleştiğini düşünüyor. Hatta onu destekleyecek (kurgusal) istatistikler bile var.

Bir Reddit’e göre iplikGoogle’ın aynı isimli GenAI modellerini kullanan Gemini, Super Bowl LVIII hakkındaki soruları sanki oyun dün veya haftalar önce bitmiş gibi yanıtlıyor. Birçok bahisçi gibi, Chiefs’i 49ers’a tercih ediyor gibi görünüyor (üzgünüm, San Francisco taraftarları).

Gemini oldukça yaratıcı bir şekilde güzelleşiyor; en azından bir oyuncu istatistikleri dökümü vererek Kansas Şefi oyun kurucusu Patrick Mahomes’in Brock Purdy’nin 253 koşu yardası ve bir touchdown’una karşı 286 yarda iki gol ve bir müdahale için koştuğunu gösteriyor.

Bu sadece İkizler burcu değil. Microsoft’un Copilot sohbet robotu da oyunun sona erdiği konusunda ısrar ediyor ve iddiayı desteklemek için hatalı alıntılar yapıyor. Ama – belki de San Francisco önyargısını yansıtıyor! – Chiefs’in değil 49ers’ın “24-21’lik final skoruyla” galip geldiği söyleniyor.

Yardımcı Pilot Super Bowl

Resim Kredisi: Kyle Wiggers / TechCrunch

Copilot, OpenAI’nin ChatGPT’sini (GPT-4) destekleyen modelle aynı olmasa da benzer bir GenAI modeli tarafından desteklenmektedir. Ancak testlerimde ChatGPT aynı hatayı yapmaktan nefret ediyordu.

ChatGPT Super Bowl

Resim Kredisi: Kyle Wiggers / TechCrunch

Bu muhabirin Reddit başlığındaki Gemini yanıtlarını kopyalama şansı olmadığı göz önüne alındığında, bunların hepsi oldukça saçma ve muhtemelen şimdiye kadar çözülmüştür. (Microsoft da bir düzeltme üzerinde çalışmasaydı şok olurdum.) Ancak bu aynı zamanda günümüzün GenAI’sının önemli sınırlamalarını ve ona çok fazla güvenmenin tehlikelerini de gösteriyor.

GenAI modellerinin gerçek bir zekası yoktur. Genellikle kamuya açık ağdan alınan çok sayıda örnekle beslenen yapay zeka modelleri, çevredeki herhangi bir verinin bağlamı da dahil olmak üzere verilerin (örneğin metnin) kalıplara dayalı olarak oluşma olasılığını öğrenir.

Bu olasılığa dayalı yaklaşım, geniş ölçekte oldukça iyi işliyor. Ancak kelimelerin aralığı ve olasılıkları büyük ihtimalle anlamlı bir metin elde etmek kesin olmaktan uzaktır. Yüksek Lisans’lar, örneğin Altın Kapı hakkındaki iddia gibi dilbilgisi açısından doğru ancak anlamsız bir şey üretebilir. Ya da eğitim verilerinde yanlışlıklar yayarak yanlış bilgileri dile getirebilirler.

LLM’ler açısından kötü niyetli değil. Kötü niyetleri yoktur ve doğru-yanlış kavramları onlar için anlamsızdır. Onlar sadece belirli kelimeleri veya cümleleri belirli kavramlarla ilişkilendirmeyi öğrendiler, bu ilişkilendirmeler doğru olmasa bile.

Gemini’nin ve Yardımcı Pilot’un Super Bowl yalanlarının nedeni budur.

Google ve Microsoft, çoğu GenAI tedarikçisi gibi, GenAI uygulamalarının mükemmel olmadığını ve aslında hata yapmaya eğilimli olduğunu hemen kabul ediyor. Ancak bu teşekkür yazılarının küçük harflerle yazıldığını ve kolaylıkla gözden kaçırılabileceğini düşünüyorum.

Super Bowl dezenformasyonu kesinlikle GenAI’nin raydan çıkmasının en zararlı örneği değil. Bu ayrım muhtemelen onaylayan işkence, takviye edici etnik ve ırksal stereotipler veya ikna edici bir şekilde yazmak Komplo teorileri hakkında. Ancak GenAI botlarının beyanlarını tekrar kontrol etmek faydalı bir hatırlatmadır. Bunların doğru olmama ihtimali oldukça yüksek.



genel-24