Google, Gemini AI modelinin neler yapabileceğini bir robotun yardımıyla göstermenin yeni bir yolunu buldu.

Bu, geçen yıl kapatılan Google’ın Everybody Robots Bölümü’nden bir robottu. Ancak görünüşe göre robotlar hala ortalıkta, bu yüzden Google bunlardan birine sarı bir papyon taktı ve sonra Gemini’yi kullanarak robota komutlara nasıl yanıt vereceğini ve DeepMind ofis alanında nasıl dolaşacağını öğretti.

Google bunu başarmak için, metinle birlikte görüntü ve videolarla eğitilen görsel dil modelleri (VLM) kullanıyor; bu sayede algı gerektiren soruları yanıtlayabiliyor ve görevleri yerine getirebiliyorlar.

Örneğin, bir videoda bir Google çalışanı robottan kendisini bir şeyler çizmesi için bir yere götürmesini istiyor. Robot düşünmek için bir dakikaya ihtiyacı olduğunu söylüyor, sonra çalışanı beyaz tahtaya götürüyor. Başka bir videoda, robota beyaz tahtadaki talimatları takip etmesi söyleniyor, burada bir harita Mavi Alan olarak adlandırılan yere gitmek için talimatları gösteriyor. Robot talimatları bir robotik test alanına kadar takip ediyor ve sonra “Beyaz tahtadaki talimatları başarıyla takip ettim.” diyor.

Robotu hareket halinde görmek için oynat’a basın, ardından yorumlarda ne düşündüğünüzü bize bildirin!



genel-24