
Nvidia, geçen hafta robotları simülasyon konusunda eğitmek için kullanılabilecek yeni bir yapay zeka (AI) modeli yayınladı. Cosmos-Transfer 1 olarak adlandırılan Yeni Dünya Nesil Büyük Dil Modeli (LLM), fiziksel yapay zeka olarak da bilinen yapay zeka ile çalışan robotik donanıma yöneliktir. Şirket, modeli açık kaynakta izin verilen bir lisansla yayınladı ve ilgilenen bireyler bunu popüler çevrimiçi depolardan indirebilir. Santa Clara merkezli teknoloji devi, en son AI modelinin ana avantajının, kullanıcıların oluşturulan simülasyonlar üzerinde ayrıntılı bir kontrole sahip olacağı olduğunu vurguladı.
Nvidia, robotları eğitmek için AI modelini yayınladı
Simülasyon tabanlı robotik eğitimi, üretken AI teknolojisindeki ilerlemeden dolayı son zamanlarda rüzgar kazanmıştır. Bu özel robotik dalı, beyni için bir AI kullanan donanımla ilgilenir. Esasen, eğitim yöntemi, makinenin beynini çeşitli gerçek dünya senaryolarında eğitir, böylece daha geniş bir görev aralığını üstlenebilir. Bu, tek bir görevi tamamlamak için tasarlanmış fabrikalardaki mevcut robotlara kıyasla büyük bir gelişmedir.
NVIDIA’nın Cosmos-Transfer1, fotoral video çıkışları oluşturmak için segmentasyon haritaları, derinlik haritaları, LIDAR taramaları ve daha fazlası gibi yapılandırılmış video girişini yutan şirketin Cosmos Transfer Dünya Vakfı Modellerinin (WFMS) bir parçasıdır. Bu çıktılar daha sonra fiziksel yapay zekayı eğitmek için simülasyon zemini olarak kullanılabilir.
Bir kağıt Arxiv Journal’da yayınlanan şirket, bu modelin seleflerinden daha fazla özelleştirme sunduğunu belirtti. Mekansal konuma dayalı farklı koşullu girdilerin ağırlığının değişmesini sağlar. Esasen, bu, geliştiricilerin son derece kontrol edilebilir dünya üretimi üretmesine izin verecektir. Modelin bir başka avantajı, daha hızlı ve daha çeşitli eğitim oturumlarında yardımcı olan gerçek zamanlı dünya neslini içerir.
Model özelliklerine gelen Cosmos-Transfer1, yedi milyar parametreye sahip difüzyon tabanlı bir modeldir. Gizli boşlukta video denolama için tasarlanmıştır ve bir kontrol dalı tarafından modüle edilebilir. Model metin ve videoyu girdi olarak kabul eder ve her ikisini de kullanarak fotogeralist bir çıkış videosu oluşturabilir. Model, Canny Edge, Blurred RGB, segmentasyon maskesi ve derinlik haritası dahil olmak üzere dört tür kontrol giriş videosunu destekler.
AI modeli Nvidia’nın Blackwell ve Hopper Serisi yonga setleri üzerinde test edilmiştir ve çıkarım Linux işletim sisteminde yürütülmüştür. Teknoloji devi, AI modelini hem akademik hem de ticari kullanıma izin veren NVIDIA Açık Model Lisans Sözleşmesi ile kullanılabilir hale getirdi.
NVIDIA’nın Cosmos-Transfer1 AI modeli, şirketin github’undan indirilebilir liste ve sarılma yüzü liste. 14 milyar parametreye sahip başka bir AI modelinin yakında yayınlanması bekleniyor.

