Google, şimdiye kadarki en güçlü AI modelleri paketi olan Gemini’yi kısa süre önce duyurdu ve şirket zaten performansı hakkında yalan söylemekle suçlanıyor.

Bir köşe yazısı Bloomberg Google’ın yakın tarihli bir videoda Gemini’nin gücünü yanlış tanıttığını iddia ediyor. Google etkileyici bir “bu ne şarlatanlık” yayınladı uygulamalı video Bu haftanın başındaki duyuru sırasında köşe yazarı Parmy Olson, videoda oldukça yetenekli göründüğünü söylüyor – belki de fazla yetenekli.

Altı dakikalık video, Gemini’nin çok modlu yeteneklerini (örneğin, görüntü tanımayla birleştirilmiş sesli konuşma istemleri) gösteriyor. Gemini, görünüşe göre görüntüleri hızlı bir şekilde tanıyor – noktaları birleştirme resimlerinde bile – saniyeler içinde yanıt veriyor ve bir kupa ve top oyununda bir tomar kağıdı gerçek zamanlı olarak takip ediyor. Elbette insanlar bunların hepsini yapabilir ancak bu, bundan sonra ne olacağını tanıyabilen ve tahmin edebilen bir yapay zekadır.

Ancak YouTube’daki video açıklamasını tıkladığınızda Google’ın önemli bir sorumluluk reddi beyanı vardır:

“Bu demonun amaçları doğrultusunda gecikme azaltıldı ve Gemini çıktıları kısa olması için kısaltıldı.”

Olson’un kızdığı şey de bu. Ona göre Bloomberg parça, Yorum istendiğinde Google, video demosunun sözlü yönlendirmelerle gerçek zamanlı olarak gerçekleşmediğini, bunun yerine ham görüntülerden hareketsiz görüntü çerçeveleri kullandığını ve ardından Gemini’nin yanıt vereceği metin istemlerini yazdığını itiraf etti. Olson, “Bu, Google’ın önerdiğinden oldukça farklı: Bir kişi, Gemini etrafındaki dünyayı izlerken ve ona gerçek zamanlı olarak yanıt verirken onunla yumuşak bir sesli görüşme yapabilir” diye yazıyor.

Google’a karşı adil olmak gerekirse, şirketler demo videolarını sık sık düzenliyor; özellikle de pek çok kişi canlı demoların getireceği teknik aksaklıklardan kaçınmak istiyor. Bazı şeyleri biraz değiştirmek yaygındır. Ancak Google’ın şüpheli video demolarıyla ilgili bir geçmişi var. İnsanlar Google’ın Duplex demosunun (kuaför salonlarını ve restoranları rezervasyon yaptırmak için arayan AI sesli asistanı Duplex’i hatırlıyor musunuz?) gerçekti çünkü ortam gürültüsünün ve çok yardımcı çalışanların belirgin bir eksikliği vardı. Yapay zeka modellerinin önceden kaydedilmiş videoları da insanları daha da şüpheci kılıyor. Baidu’nun düzenlenmiş videolarla Ernie Bot’u başlattığı ve hisselerinin düştüğü zamanı hatırlıyor musunuz?

Böyle bir durumda Olson, Google’ın insanları Gemini’nin hala OpenAI’nin GPT’sinin gerisinde olduğu gerçeğinden yanıltmak için “gösteriş yaptığını” söylüyor.

Google aynı fikirde değil. Demonun geçerliliği sorulduğunda şunu belirtti: Sınır ile Oriol Vinyals’tan bir gönderiGoogle’ın DeepMind’inde araştırma ve derin öğrenmeden sorumlu başkan yardımcısı (aynı zamanda Gemini’nin ortak lideri), bu da ekibin videoyu nasıl yaptığını açıklıyor.

Vinyals, “Videodaki tüm kullanıcı istemleri ve çıktıları gerçektir ve kısa olması için kısaltılmıştır” diyor. “Video, Gemini ile oluşturulan çok modlu kullanıcı deneyimlerinin nasıl görünebileceğini gösteriyor. Bunu geliştiricilere ilham vermek için yaptık.”

Ekibin Gemini’ye görseller ve metinler verdiğini ve bundan sonra ne olacağını tahmin ederek yanıt vermesini istediğini ekledi.

Bu kesinlikle bu duruma yaklaşmanın bir yolu, ancak bu, en azından kamuoyunun gözünde, OpenAI’nin bu yılki muazzam başarısı karşısında dümdüz yakalanmış görünen Google için doğru yol olmayabilir. Geliştiricilere ilham vermek istiyorsa, bu, AI’nın yeteneklerini tartışmalı bir şekilde yanlış temsil eden dikkatlice düzenlenmiş cızırtılı makaralar aracılığıyla değildir. Bu, gazetecilerin ve geliştiricilerin ürünü gerçekten deneyimlemelerine olanak sağlamak yoluyla gerçekleşir. İnsanların halka açık küçük bir beta sürümünde Gemini ile aptalca şeyler yapmasına izin verin. Bize gerçekte ne kadar güçlü olduğunu gösterin.





genel-2