Gemini’nin Android cihazıma nasıl devam edeceğimi neredeyse hiç anlamadım ve Google zaten Gemini 2.0’ı gerçek hayat robotlarına koyduğunu duyurdu. Şirket, bir blogda yazarken “yeni nesil yararlı robotların temelini atan” iki yeni AI modelini duyurdu. Gösterilerde, robotlar insanlara benziyor!
İkizler Robotics, Gemini 2.0 üzerine inşa edilmiş gelişmiş bir görme-dil-aksiyon (VLA) modelidir-PDF’leri beslediğim ve burçlarla ilgili yardım istediğimi. Gemini 2.0’ın bu versiyonu, bir sorguya çıktı yanıtı olarak fiziksel eylemlerin eklenmesine sahiptir. Örneğin, Piksel telefonunda Gemini’nin “yanıtı” bir eylem yapmak veya bir soruyu cevaplamak olacaktır. Bir robottaki İkizler bunun yerine bu komutu fiziksel olarak yanıt vermesi gereken bir şey olarak görür.
İkinci AI modeli, “gelişmiş mekansal anlayış” ile bir vizyon dili (VLM) modeli olan Gemini Robots-ER’dir. Gemini, yapay zekanın gerçek zamanlı olarak değişse bile ortamında gezinmesine yardımcı olan “somutlaşmış akıl yürütmesini” alır. Örnek bir videoda Google, gazetecilerle kapalı bir oturumda gösterilen robot, bir masadaki değişen kaplamalar ve renkler arasında ayrım yapabilir. Ayrıca üzüm ve muz gibi sahte meyveler arasında ayrım yapabilir ve daha sonra her birini belirli kaselerden birine dağıtabilir. Başka bir örnekte Google, bir robotun öğle yemeği çantasında paketlenmesi gereken bir tupperware kabında granola nüansını anladığını gösterdi.

Google DeepMind, robot kollarının nasıl bir kaptan üzüm alabileceğini ve tezgahın üzerine yerleştirebileceğini gösterir.
Bu duyurunun merkezinde Google, DeepMind’in Gemini’yi robotik alana düşebileceği bir tür “beyin” haline getirme çabalarını övüyor. Ancak, elinizdeki akıllı telefon için AI markalaşmasının, bazı kapasitelerde insansı bir robota güç vereceğini düşünmek vahşidir. Google’ın DeepMind kıdemli direktörü ve robot başkanı Carolina Parada, “Modellerimizin yeteneklerini keşfetmeyi ve bunları gerçek dünya uygulamalarına giden yolda geliştirmeye devam etmeyi dört gözle bekliyoruz” diyor.
Google, “yeni nesil insansı robotları oluşturmak için Apptronik gibi şirketlerle ortaklık kuruyor. Gemini Robots-ER modeli, çevik robotlar, çeviklik robotları, Boston dinamikleri ve büyülü araçlar da dahil olmak üzere testler için ortaklar için kullanılabilir olacak. Robotlar geliyor, ama zaman çizelgesi yok. Şimdilik tepkinizi temperleyebilirsiniz.
Google ayrıca, İkizler Korumaları ile ilgili kaçınılmaz olarak alacağı soruların saldırısına hazırlanıyor. Robotun ters gitmemesi ve bir insana fiziksel acıya neden olması için hangi korumaların yerinde olduğunu bile sordum. Google, “Gemini Robotics-ER modellerinin, potansiyel bir eylemin belirli bir bağlamda gerçekleştirilmesi güvenli olup olmadığını anlamasını sağlıyoruz,” diye açıklıyor Google, bunu gibi çerçevelere dayandırarak Asimov veri setibu da “araştırmacıların gerçek dünya senaryolarında robotik eylemlerin güvenlik sonuçlarını titizlikle ölçmelerine” yardımcı oldu. Google, “AI uygulamalarını sorumlu bir şekilde geliştirmemizi sağlamak” için bu alandaki uzmanlarla işbirliği yaptığını söylüyor.

