- İkizler Robotik yeni bir model
- Fiziksel dünyaya odaklanır ve robotlar tarafından kullanılacaktır
- Görsel, etkileşimli ve genel
Google Gemini, üretken metin ve görüntüler de dahil olmak üzere bir ekranda meydana gelen birçok şeyde iyidir. Yine de, en son model olan Google Robotics, üretken AI’yı fiziksel dünyaya taşıyan ve insansı robot devrim yarışını önemli ölçüde hızlandırabilecek bir vizyon dili eylem modelidir.
İkizler Robotik, Google’ın DeepMind Çarşamba günü açıklandıİkizler’in üç kilit alandaki yeteneklerini geliştirir:
- El becerisi
- Etkileşim
- Genelleme
Bu üç yönün her biri, robotiklerin işyerinde ve bilinmeyen ortamlardaki başarısını önemli ölçüde etkiler.
Genelleme, bir robotun Gemini’nin dünya ve şeyler hakkında geniş bilgisini almasına, yeni durumlara uygulamasına ve hiç eğitilmediği görevleri yerine getirmesine izin verir. Bir videoda, araştırmacılar Gemini Robotics tarafından kontrol edilen bir çift robot kolu, masa üstü basketbol oyunu ve “basketbol slam dunk” ı isteyin.
Robot oyunu daha önce görmemiş olsa da, küçük turuncu topu aldı ve plastik ağdan doldurdu.
Google Gemini Robotics ayrıca robotları daha etkileşimli hale getirir ve sadece değişen sözlü ödevlere değil, aynı zamanda öngörülemeyen koşullara da yanıt verir.
Başka bir videoda, araştırmacılar robottan muzlu bir kaseye üzüm koymalarını istediler, ancak robot kolu ayarlanırken kaseyi hareket ettirdiler ve hala üzümleri bir kaseye koymayı başardılar.

Google ayrıca robotun ahşap bir tahtada Tic-Tac-Toe oynamak, bir beyaz tahtayı silmek ve kağıdı origami’ye katlamak gibi şeylerle mücadele etmesini sağlayan becerikli yeteneklerini de gösterdi.
Robotlar, her görevde saatlerce antrenman yapmak yerine, yakınlara yakın doğal dil talimatlarına yanıt verir ve görevleri rehberlik etmeden gerçekleştirir. İzlemek etkileyici.
Doğal olarak, robotiklere AI eklemek yeni değildir.
Geçen yıl Openai, sözel talimatlara dayalı görevleri çözebilen insansı bir robot geliştirmek için Şekil AI ile ortaklık kurdu. İkizler Robotiklerinde olduğu gibi, Şekil 01’in görsel dil modeli, görevler ve değişen öncelikler hakkında ileri geri konuşmalar yapmak için Openai Konuşma Modeli ile birlikte çalışır.
Demoda, insansı robot bulaşıklardan önce durur ve bir drenaj. Ne gördüğü, listelediği sorulur, ancak daha sonra muhatap görevleri değiştirir ve yiyecek bir şeyler ister. Bir ritmi kaçırmadan, robot bir elma alır ve ona verir.
Google’ın videolarda gösterdiği şeylerin çoğu, çok çeşitli fiziksel görevlerde çalışan robot kolları ve eller çekilirken, daha büyük planlar var. Google ile ortaklık kuruyor Apptroniks Yeni modeli Apollo insansı robotuna eklemek için.
Google, Gemini Robotics-ER (somutlaşmış akıl yürütme) adlı yeni bir gelişmiş görsel dil modeli olan ek programlama ile noktaları birleştirecek.
Gemini Robotics-ER, robotik mekansal akıl yürütmeyi geliştirecek ve robot geliştiricilerin modelleri mevcut denetleyicilere bağlamasına yardımcı olmalıdır.
Yine, bu anında akıl yürütmeyi geliştirmeli ve robotların tanıdık olmayan nesneleri nasıl kavrayacağını ve kullanacağını hızlı bir şekilde anlamasını mümkün kılmalıdır. Google, Gemini Rotbotics’i uçtan uca bir çözüm çağırıyor ve “algı, devlet tahmini, mekansal anlayış, planlama ve kod üretimi de dahil olmak üzere bir robotu kutudan çıkarmak için gerekli tüm adımları gerçekleştirebileceğini” iddia ediyor.
Google, Boston Dynamics (Atlas Yapımcıları), çevik robotlar ve çeviklik robotları da dahil olmak üzere çeşitli iş ve araştırma odaklı robot firmalarına Gemini Robotics-ER modeli sunuyor.
Sonuçta, insansı robot geliştiricileri için potansiyel bir nimet. Bununla birlikte, bu robotların çoğu fabrikalar için veya hala laboratuvarda tasarlandığından, evinizde İkizli bir robot almanız biraz zaman alabilir.

