Figür kurucusu ve CEO’su Brett Adcock Perşembe açıklığa kavuşmuş İnsansı robotlar için yeni bir makine öğrenme modeli. Adcock’un Bay Area robotik firmasının bir Openai işbirliğinden uzaklaşma kararını duyurduktan iki hafta sonra gelen haberler, “genel” vizyon dil (VLA) modeli olan Helix’in etrafında toplanıyor.
VLA’lar, robotik, vizyon ve dil komutlarından yararlanmak için yeni bir fenomendir. Şu anda, kategorinin en bilinen örneği, robotları video ve büyük dil modellerinin (LLMS) bir kombinasyonu aracılığıyla eğiten Google DeepMind’in RT-2’sidir.
Helix, bir robotu gerçek zamanlı olarak kontrol etmek için görsel verileri ve dil istemlerini birleştirerek benzer bir şekilde çalışır. Şekil şöyle yazıyor: “Helix, güçlü nesne genellemesi sergiliyor, sadece doğal dilde sorarak, daha önce hiç karşılaşmayan değişen şekiller, boyutlar, renkler ve malzeme özelliklerine sahip binlerce yeni ev eşyasını alabiliyor.”

İdeal bir dünyada, bir robota bir şeyler yapmasını söyleyebilirsiniz ve sadece bunu yapar. Figüre göre Helix devreye giriyor. Platform, vizyon ve dil işleme arasındaki boşluğu kapatmak için tasarlanmıştır. Doğal bir dil ses istemini aldıktan sonra, robot çevresini görsel olarak değerlendirir ve sonra görevi yerine getirir.
Şekil, “kurabiye torbasını sağınızdaki robota teslim edin” veya “Soldaki robottan kurabiye torbasını alın ve açık çekmeceye yerleştirin” gibi örnekler sunmaktadır. Bu örneklerin her ikisi de birlikte çalışan bir çift robot içerir. Bunun nedeni, Helix’in aynı anda iki robotu kontrol etmek için tasarlanmasıdır, biri diğerinin çeşitli ev görevlerini yerine getirmesine yardımcı olur.
Figür, şirketin ev ortamında 02 insansı robotuyla yaptığı çalışmayı vurgulayarak VLM’yi sergiliyor. Evler, depoların ve fabrikaların yapısından ve tutarlılığından yoksun oldukları göz önüne alındığında, robotlar için çok zor.
Öğrenme ve kontrol konusunda zorluk, karmaşık robot sistemleri ve ev arasında duran büyük engellerdir. Bu sorunlar, beş ila altı haneli fiyat etiketleri ile birlikte, ev robotunun çoğu insansı robot şirketi için öncelikli olmamasının nedenidir. Genel olarak konuşursak, yaklaşım endüstriyel müşteriler için robotlar oluşturmaktır, hem güvenilirliği artırır hem de konutlarla mücadele etmeden önce maliyetleri düşürür. Ev işi bundan birkaç yıl sonra bir sohbet.
TechCrunch, 2024’te figürün Bay Area ofislerini gezdiğinde, Adcock şirketin ev ortamında insansı koyduğu adımları attı. Figür BMW gibi şirketlerle işyeri pilotlarına odaklandığından, çalışmanın önceliklendirilmediği zaman ortaya çıktı.

Perşembe günkü Helix duyurusu ile Figür, evin kendi başına bir öncelik olması gerektiğini açıkça ortaya koyuyor. Bu tür eğitim modellerini test etmek için zorlu ve karmaşık bir ortam. Robotlara mutfakta karmaşık görevler yapmayı öğretmek – örneğin – bunları farklı ortamlarda geniş bir eylem yelpazesine açar.
“Robotların hanelerde yararlı olması için, özellikle daha önce hiç görmedikleri nesneler için, isteğe bağlı akıllı yeni davranışlar üretebilmeleri gerekecektir” diyor. “Robotlara yeni bir davranış bile öğretmek şu anda önemli bir insan çabası gerektiriyor: her ya doktora düzeyinde uzman manuel programlama veya binlerce gösteri.”
Manuel programlama ev için ölçeklenmez. Çok fazla bilinmeyen var. Mutfaklar, oturma odaları ve banyolar birinden diğerine önemli ölçüde değişir. Aynı şey pişirme ve temizlik için kullanılan araçlar için de söylenebilir. Ayrıca, insanlar karışıklık bırakıyor, mobilyaları yeniden düzenliyor ve bir dizi farklı çevresel aydınlatmayı tercih ediyorlar. Bu yöntem çok fazla zaman ve para gerektirir – rakam kesinlikle ikincisi vardır.
Diğer seçenek eğitim – ve birçoğu. Nesneleri laboratuvarlara seçmek ve yerleştirmek için eğitilmiş robotik kollar genellikle bu yöntemi kullanır. Görmediğiniz şey, yüzlerce saatlik tekrarlama, bir demoyu çok değişken görevleri üstlenecek kadar sağlam hale getirmek için alıyor. İlk kez bir şey almak için, bir robotun geçmişte yüzlerce kez yapması gerekiyor.
Şu anda çok fazla insansı robotik gibi, Helix’te çalışmak hala çok erken bir aşamada. İzleyicilere, bu yazıda görülen kısa, iyi üretilen videoları yaratmak için perde arkasında çok fazla çalışma yapılması önerilmelidir. Bugünkü duyuru, özünde, projenin büyümesine yardımcı olmak için daha fazla mühendis getirmek için tasarlanmış bir işe alım aracıdır.

