Google DeepMind, robotların “her zamankinden daha geniş bir gerçek dünya görevleri sergilemesine” yardımcı olmak için tasarlanmış iki yeni AI modeli piyasaya sürüyor. İkizler Robotics olarak adlandırılan birincisi, onlar üzerinde eğitilmemiş olsa bile, yeni durumları anlayabilen bir vizyon dilli aksiyon modelidir.
Gemini Robotics, Google’ın amiral gemisi AI modelinin en son sürümü olan Gemini 2.0 üzerine kurulmuştur. Bir basın brifingi sırasında, Google DeepMind’deki Robotik Kıdemli Direktörü ve Başkanı Carolina Parada, Gemini Robotics’in “Gemini’nin çok modlu dünya anlayışından yararlandığını ve yeni bir yöntem olarak fiziksel eylemler ekleyerek gerçek dünyaya aktardığını” söyledi.
Yeni model, Google DeepMind’in yararlı robotlar oluşturmak için gerekli olduğunu söylediği üç kilit alanda ilerlemeler yapar: genellik, etkileşim ve el becerisi. Yeni senaryoları genelleştirme yeteneğine ek olarak, İkizler Robotikleri insanlarla ve çevreleriyle etkileşimde daha iyidir. Ayrıca, bir kağıt parçasını katlamak veya bir şişe kapağını çıkarmak gibi daha hassas fiziksel görevler gerçekleştirebilir.
“Bu alanların her birinde geçmişte genel robotiklerle bireysel olarak ilerleme kaydetmiş olsak da, [drastically] Tek bir modelle her üç alanda da artan performans ”dedi. “Bu, daha yetenekli, daha duyarlı ve çevrelerindeki değişikliklere karşı daha sağlam olan robotlar oluşturmamızı sağlıyor.”
Google DeepMind ayrıca şirketin “karmaşık ve dinamik dünyamızı anlayabilen” gelişmiş bir görsel dil modeli olarak tanımladığı Gemini Robotics-ER’yi (veya somutlaşmış akıl yürütmeyi) başlatıyor.
Parada’nın açıkladığı gibi, bir öğle yemeği kutusu paketlerken ve önünüzdeki bir masada eşyalar olduğunda, her şeyin nerede olduğunu ve öğle yemeği kutusunu nasıl açacağınızı, öğeleri nasıl kavrayacağınızı ve nereye yerleştirileceğini bilmeniz gerekir. Gemini Robotics’in yapması bekleniyor. Robotikçilerin mevcut düşük seviyeli kontrolörlerle bağlantı kurmaları için tasarlanmıştır-bir robotun hareketlerini kontrol eden sistem-İkizler Robotics-ER tarafından güçlendirilen yeni yetenekleri etkinleştirmelerine izin verir.
Güvenlik açısından, Google DeepMind araştırmacısı Vikas Sindhwani gazetecilere verdiği demeçte, şirketin “katmanlı bir yaklaşım” geliştirdiğini, Gemini Robotics-ER modellerinin “potansiyel bir eylemin belirli bir senaryoda gerçekleştirilip gerçekleştirilemeyeceğini değerlendirmek için eğitildiğini” söyledi. Şirket ayrıca AI endüstrisinde daha fazla güvenlik araştırmasına yardımcı olmak için yeni ölçütler ve çerçeveler yayınlıyor. Geçen yıl, Google Deepmind, Robotlarının takip etmesi için bir dizi Isaac Asimov’dan ilham alan “Robot Anayasası” nı tanıttı.
Google DeepMind, “yeni nesil insansı robotları oluşturmak” için Apptronik ile çalışıyor. Ayrıca, “güvenilir test uzmanları” İkizler Robotics-ER modeline erişim sağlıyor. Çevik RobotlarÇeviklik robotları, Boston dinamiği ve Büyülü Araçlar. Parada, “Fiziksel dünyayı anlayabilecek ve o fiziksel dünyada hareket edebilecek zekayı inşa etmeye çok odaklandık” dedi. “Temel olarak bunu bizim için birden fazla düzenlemede ve birçok uygulamadan yararlanmaktan çok heyecan duyuyoruz.”

