OpenAI, iki hafta önce 2021’de kapanan robotik programını yeniden başlatacağını duyurdu. Bu, büyük AI laboratuvarlarının fiziksel dünyada etkileşimde bulunabilen makineler öğretme yarışının bir göstergesi. Ancak, başarılı robotlar geliştirmek için, AI endüstrisinin henüz sahip olmadığı bir şeye ihtiyaç var: dil modelleri için kullanılan verileri karşılayacak eğitim verisine.
Bu boşluk, yeni bir altyapı iş modeli oluşturuyor. Kamuya açık metinlerle eğitilen büyük dil modellerinin aksine, robotların fiziksel etkileşimi yakalayan verilere ihtiyacı var ve bu tür veriler oldukça sınırlı. YouTube videoları ve gig çalışanları tarafından kaydedilen görüntüler, düşük kalitede ve fiziksel dünya ile uyum sağlamakta zorlanıyor.
XDOF (eyks-doff olarak okunur), bu sorunun üstesinden gelmek için yola çıkıyor ve AI için veri geri bildirim döngüsünün bir bottleneck olduğunu iddia ediyor. Şirket, robotların fiziksel dünya ile nasıl etkileşimde bulunacağını öğretmek için gerekli veri altyapısını inşa etmeyi hedefliyor.
1800 çalışanı ile XDOF, bu hedefe ulaşmak için Thrive Capital, Spark Capital, a16z, Lux ve WndrCo’dan 70 milyon dolar fon topladı. Kurucu ortaklardan ve CEO’su Philippe Wu, XDOF’un 20 müşterisi olduğunu ve bunların arasında bazı öncü AI laboratuvarlarının bulunduğunu belirtti, ancak isim veremedi.
Wu, “Tüm üst laboratuvarlar robotik peşinde koşuyor,” dedi. “Dil modeli yarışında biraz geri kaldığımızda bazı olumsuzlukları gördük… Bu teknolojiyi çok geç kovalamak istemiyorsunuz, fiziksel AI’nın bir sonraki sınır olduğunu unutmamak lazım.”
Bu sorunla karşılaşan Wu, UC Berkeley’de doktora öğrencisiyken, robotları büyük ölçekli veri setlerinden beceriler öğrenmeye yönlendirmeye çalıştı. Ancak büyük ölçekli veriye erişimleri yoktu.
Wu ve gelecekteki XDOF kurucu ortağı ve CTO’su Fred Shentu, insan operatörlerinin bir robot kolunu kontrol ederek eğitim verisi üretmesini sağlayan düşük maliyetli bir uzaktan operasyon sistemi olan GELLO üzerine çalıştılar. “Bu, robotik alanında çok etkili bir makale haline geldi çünkü birçok kişi benzer ihtiyaçlarla karşılaştı ve bu tür cihazları veri toplamak için kullanmaya başladılar,” diye ekledi Wu.
Fırsatı gören Wu, Shentu ve üçüncü kurucu ortak ve COO’su Nemo Jin, Ekim 2024’te robotik modeller peşinde koşan şirketler için bir veri ekosistemi sunmak amacıyla XDOF’u kurdu. Şirket, yalnızca veri temin etmenin tek başına bir dead-end iş olabileceğini düşünerek, veri temizleme, araç geliştirme ve anotasyon konularına da odaklanıyor; böylece robot eğitmenleri için kendini güçlendiren bir geri bildirim döngüsü oluşturuyor.
Şirket, başlangıç olarak UC Berkeley’in AI Araştırma laboratuvarı ile ortaklık kurdu ve tarihi bir koleksiyon olan ABC’yi ortaya çıkardı. Bu, toplamda 130,000 trajektör robot manipülasyon verisi, 300 saat simülasyon ve 100 saat değerlendirmeyi içeriyor. Böyle bir ölçeklenmiş ön eğitim verisi, akademiye daha önce hiç sunulmamıştı.
“Dil, resim üretimi ve diğer alanlarda, modeller ve veriler serbest bırakıldığında topluluk beklenmedik başarılar elde ediyor,” dedi bu sürecin bir parçası olan Berkeley’den David McAllister.
Robotların Sınırsız Hareket Özgürlüğü
Şirket, verilerin üç katmanlı bir yapı üzerinde ilerlemeyi planlıyor. En değerli katman, gerçek robot üzerinde toplanan teleoperasyon verisi; ardından GELLO gibi daha genel veri toplayan teleoperatörler geliyor; son olarak, “egosentrik” veri, gündelik görevleri yerine getiren insanlar tarafından toplanacak. XDOF, bu tür veriler için kendi giyilebilir sensörlerini geliştirmeyi hedefliyor.
“Kamera seçimleriniz, verilerinizin kalitesini etkileyecek — bu da, el izleme algoritmanızın nasıl performans gösterdiğini belirleyecek,” diye belirtti Wu. “Eğer donanımı başlangıçtan iyi tasarlamazsanız, topladığınız veriler beklenmedik şekilde sorunlar içerebilir.”
Şirketin amacı, dünya genelinde teleoperatörler ve egosentrik veri operatörlerinden oluşan ordular kurmak; bu da iş gücü açısından yoğun bir model ortaya çıkarıyor. Peki, büyük laboratuvarlar neden bu veri üretim işini kendileri yapmıyor?
“Yüzlerce robotun bulunduğu yüz binlerce metrekarelik bir depoya ihtiyacınız var,” dedi Wu. “Bu robotları bakımını yapmak, fiziksel parametrelerini kalibre etmek ve operatörleri doğru bir şekilde eğitmek gerekiyor.”
Bunları inşa etmek, odaklanma, sermaye ve operasyonel ölçek gerektiriyor ve çoğu AI laboratuvarı bu işin outsource edilmesini tercih ediyor. XDOF’un hedefi tam olarak bu piyasa.
XDOF ismi, bir robotun gerçekleştirebileceği bağımsız hareketlerin sayısını tanımlayan “hareket serbestliği” terimine bir gönderme. Bir insan kolunun yedi hareket serbestliği vardır; insan benzeri robotik şirket Figure.AI’nın en yeni robotu ise 30’a sahip. Şirketin ismindeki X, “Rastgele hareket serbestliği, sınırsız hareket serbestliği” şeklinde bir hırsı temsil ediyor.”
Robot teknolojisinin gelişimini nasıl görüyorsunuz? Bu alandaki yenilikler sizce gelecekte neleri değiştirebilir?

