Google DeepMind, Gerçek Dünya Ortamlarında Gezinebilen Robotlara Gemini 1.5 Pro'yu Entegre Ediyor - Dünyadan Güncel Teknoloji Haberleri

Google DeepMind, Gerçek Dünya Ortamlarında Gezinebilen Robotlara Gemini 1.5 Pro’yu Entegre Ediyor

Google DeepMind, Perşembe günü robotik ve görme dili modelleri (VLM’ler) alanında yapılan yeni gelişmeleri paylaştı. Teknoloji devinin yapay zeka (AI) araştırma bölümü, robotlarda yeni yetenekler geliştirmek için gelişmiş görme modelleriyle çalışıyordu. DeepMind, yeni bir çalışmada, Gemini 1.5 Pro ve uzun bağlam penceresinin kullanılmasının, bölümün artık robotlarının navigasyonunda ve gerçek dünya anlayışında çığır açan gelişmeler kaydetmesini sağladığını vurguladı. Bu yılın başlarında, Nvidia ayrıca insansı robotlarda gelişmiş yeteneklere güç veren yeni AI teknolojisini tanıttı.

Google DeepMind, Robotları Geliştirmek İçin Gemini AI’yı Kullanıyor

İçinde postalamak X’te (eski adıyla Twitter), Google DeepMind, robotlarını Gemini 1.5 Pro’nun 2 milyon token bağlam penceresini kullanarak eğittiğini açıkladı. Bağlam pencereleri, bir AI modelinin görebildiği bilgi penceresi olarak anlaşılabilir ve bu pencereyi kullanarak sorgulanan konu etrafındaki teğetsel bilgileri işler.

Örneğin, bir kullanıcı bir AI modeline “en popüler dondurma aromaları” hakkında soru sorarsa, AI modeli bu soruya ilişkin bilgi bulmak için dondurma ve aromalar anahtar kelimesini kontrol edecektir. Bu bilgi penceresi çok küçükse, AI yalnızca farklı dondurma aromalarının adlarıyla yanıt verebilecektir. Ancak, daha büyükse, AI ayrıca her dondurma aroması hakkında kaç makale olduğunu görebilecek ve hangisinin en çok bahsedildiğini bulabilecek ve “popülerlik faktörünü” çıkarabilecektir.

DeepMind, robotlarını gerçek dünya ortamlarında eğitmek için bu uzun bağlam penceresinden yararlanıyor. Bölüm, robotun bir ortamın ayrıntılarını hatırlayıp hatırlayamayacağını ve ortam hakkında bağlamsal veya belirsiz terimlerle sorulduğunda kullanıcılara yardımcı olup olamayacağını görmeyi amaçlıyor. Instagram’da paylaşılan bir videoda, AI bölümü, bir robotun kullanıcıya çizim yapabileceği bir yer sorduğunda onu bir beyaz tahtaya yönlendirebildiğini gösterdi.

Google DeepMind bir gönderide, “1.5 Pro’nun 1 milyon token bağlam uzunluğuyla desteklenen robotlarımız, bir alanda yollarını başarılı bir şekilde bulmak için insan talimatlarını, video turlarını ve sağduyulu muhakemeyi kullanabilir” ifadesini kullandı.

İçinde çalışmak arXiv’de (hakemli olmayan çevrimiçi bir dergi) yayınlanan DeepMind, bu atılımın ardındaki teknolojiyi açıkladı. Gemini’ye ek olarak, aynı zamanda kullanarak kendi Robotic Transformer 2 (RT-2) modeli. Hem web hem de robotik verilerinden öğrenen bir vizyon-dil-eylem (VLA) modelidir. Gerçek dünya ortamlarını işlemek ve bu bilgileri veri kümeleri oluşturmak için kullanmak için bilgisayarlı vizyonu kullanır. Bu veri kümesi daha sonra üretken AI tarafından işlenerek bağlamsal komutları parçalayıp istenen sonuçları üretebilir.

Şu anda, Google DeepMind bu mimariyi, çevre keşfi ve talimat rehberliğinde gezinmeyi içeren Çok Modlu Talimat Gezintisi (MIN) olarak bilinen geniş bir kategoride robotlarını eğitmek için kullanıyor. Bölüm tarafından paylaşılan gösteri meşruysa, bu teknoloji robotik bilimi daha da ilerletebilir.

genel-8

Google DeepMind, Gerçek Dünya Ortamlarında Gezinebilen Robotlara Gemini 1.5 Pro’yu Entegre Ediyor

Byteknomers

Google DeepMind, Robotları Geliştirmek İçin Gemini AI’yı Kullanıyor

By teknomers

Benzer İçerikler

FBI, Trump mitingindeki saldırganın Steam hesabını bulduğunu ve ardından geri aldığını söyledi

Fisker galibiyet aldı, bir AV girişimi Teksas’ta yeniden başlatıldı ve Elon neden Tesla robotaksi duyurusunu zorladı

Testte 130 W’lık Ugreen güç bankası: El bagajı için 20.000 mAh

Battlefield 2042 sezonları sona eriyor ancak eski etkinlikler geri geliyor

Spy X Anya: Operation Memories İncelemesi

Minecraft’ta Tekne Nasıl Yapılır

Nintendo, geçen haftaki ürkütücü fragmanının ardından Emio – The Smiling Man: Famicom Detective Club’ı duyurdu

Apple’ın premium Beats Fit Pro kulaklıkları, nadir görülen 50 dolarlık indirimle Prime Day 2024’te kalıcı bir fırsat

Galaxy Fold 6 için 1900 dolar ödemeli misiniz? | PA Show E10

Samsung’un son taklit taktikleri herkes için hayal kırıklığı yaratan bir haber

Şimdi Amazon’daki en düşük fiyatlardan birinde JBL Flip 6’yı satın almanın zamanı

NASA’nın CURIE Görevi Güneş’in Gizemli Radyo Bilmecelerini Çözecek

NASA VIPER Ay Gezgini’nin Fişini Neden Çekti

Gaia mikrometeoroid ve güneş fırtınasına maruz kaldı

Altı yeni ötegezegenle 5.500 keşif kilometre taşı aşıldı

İlginizi Çekebilir

Yapay Zeka Dezenformasyona Karşı Savaşta Joker Olarak Kalmaya Devam Ediyor

FBI, Trump mitingindeki saldırganın Steam hesabını bulduğunu ve ardından geri aldığını söyledi

Honor MagicBook Art 14, çıkarılabilir bir web kamerasıyla yenilik getiriyor ve bunu etkileyici dizüstü bilgisayar özellikleriyle destekliyor

Stardew Valley’de Meşe Reçinesi Nasıl Elde Edilir