Google’ın İkizler ile uygulamalı video, firmanın yeni AI geniş dil modeli (LLM) lansmanının en etkileyici yönlerinden biriydi. Fakat, Bloomberg videonun gerçek zamanlı olarak kaydedilmediğini itiraf eden bir Google sözcüsüyle konuştu. Üstelik sesli komutlar bile kullanılmamış, Gemini ile duyduğunuz ses etkileşimi sonradan dublajlanmış. Google ayrıca bir yayınladı Blog yazısıvideonun nasıl yapıldığını gösteren demoyla aynı anda.

Google CEO’su Sundar Pichai perşembe günü uygulamalı videoyu paylaştı. dedi “Gemini’nin altında yatan inanılmaz yetenekleri anlamanın en iyi yolu onları çalışırken görmektir.” Videonun YouTube açıklamasında her şeyin göründüğü gibi olmadığına dair bir ipucu vardı. Bir dipnotta “Bu demonun amaçları doğrultusunda gecikme azaltıldı ve Gemini çıktıları kısa olması için kısaltıldı” yazıyor.

Daha fazla gör

Ancak bu dipnot, yetersiz bir ifade veya gerçeklerden saptırma olarak tanımlanabilir. Video sadece kısaltılmadığından kayıt sırasında gerçek bir etkileşim yaşanmadı. Google’ın sözcüsü Bloomberg’e, uygulamalı videonun “görüntüdeki sabit görüntü çerçeveleri kullanılarak ve metin yoluyla yönlendirme” ile bir araya getirildiğini söyledi. Bu nedenle Gemini yalnızca yazılan komutlara ve kendisine yüklenen hareketsiz görüntülere yanıt verdi. İnsanların konuşması, çizim yapması, nesneleri göstermesi, bardaklarla ve diğer nesnelerle oynamasından oluşan konuşma akışı, görünüşte sadece demo video için sahnelendi.

(Resim kredisi: Google)

Videoya dönüp baktığımızda, sözcünün açıklamasının, demoyu ilk kez gördüğümüzde edindiğimiz doğal konuşma asistanı izlenimini yerle bir ettiğini görüyoruz.





genel-21