Kendini sanatçı, aptal ve yapımcı olarak ilan eden bir kişi, Google’ın artık gözden düşmüş olan Gemini demosunu, en bariz yapay zeka rakibi ChatGPT’nin teknolojisini kullanarak yeniden hazırladı. Greg Teknoloji adını taşıyan teknoloji tamircisinin bir ördek çizimini tartıştığı, bazı el sinyali emojileri hakkında sorular sorduğu ve oynanan bir oyunu tanımlamak için OpenAI’nin GPT-4V yapay zekasını aldığı kısa bir video yayınladı. Greg’in videosu Gemini AI demosunun şıklığından yoksun olabilir, ancak ses ve görüntü komutlarını gerçek zamanlı olarak baştan sona gerçekten karıştırıyor.

Greg Technology’nin video kaydıyla ilgili bazı bağlamlar için Google’ın Gemini AI lansman videosu “İkizler ile Uygulamalı” başlıklı. Lansman gününde bu video, Google CEO’su Sundar Pichai’ye göre “Gemini’nin altında yatan şaşırtıcı yeteneklerin onları çalışırken görmek olduğunu” anlamanın en iyi yolu olduğu iddia edilen amiral gemisi videosuydu.

Çok geçmeden etkileyici derecede sevimli ve şık Google Gemini AI’nın ortaya çıktığı ortaya çıktı. video sahnelendi. AI gözlemcileri arasında hayal kırıklığına neden olan ana sorun, sunulan videonun gerçek zamanlı olarak kaydedilmemesiydi; bunun yerine Gemini, bir dizi durağan görüntüye yanıt verdi. Ek olarak, tüm sesli etkileşimler daha sonra video prodüksiyon sürecinin bir parçası olarak seslendirildi, oysa Gemini aslında demo boyunca metin komutlarına yanıt vermişti.

Yukarıda, Gemini AI “uygulamalı” macerasının bazı önemli bölümlerini kopyalayan Greg Technology’nin gerçek zamanlı demosunu görebilirsiniz. Greg, klibin ilk yarısında aksiyona bir giriş yapıyor. Kısaca, sunucunun konuşması ve bir şeyler yapması arasında gidip gelen “süper heyecan verici” Gemini videosunu izlediğini hatırlıyor; yapay zeka robot sesi, neler olduğunu anladığını gösteriyor. Greg’e göre Google “gerçekten dürüst bir demo değildi.”

Google için bu çetrefilli durum, Greg’in kendi “Google Gemini sahte demosunun yeniden yapımını, GPT-4 kullanmak dışında ve bu gerçek.” yapıp yapamayacağını merak etmesine neden oldu. Bu nedenle, gömülü videonun başlığı.

Geçtiğimiz haftalarda GPT-4’e önemli bir güncelleme geldi ve bir vizyon uzantısı mevcuttu. Greg, GPT-4V ile Gemini AI demosunu yeniden oluşturabileceğini düşündü ve videosunun ikinci yarısında onu aynı AI esneme egzersizlerinden birkaçını yaparken görebilirsiniz. Greg Teknolojisi sırasında gördüğümüz/duyduğumuz şeylerden biri, kullanıcının sesli uyarısı ile GPT-4V’nin sözlü yanıt vermesi arasındaki hamile boşluktur. Google’ın “Gemini ile Uygulamalı” demo videosu, “gecikme azaltıldı ve Gemini çıktıları kısa olması için kısaltıldı” şeklinde bir sorumluluk reddi beyanıyla başlatıldı. Ancak ne yazık ki demo gösteri filminin bundan çok daha fazla işlem sonrası ve düzenleme sürecinden geçtiğini öğrendik.

Greg Technology yaptığı demo kodu mevcut GitHub aracılığıyla.



genel-21