Artık yapay zekanın robotları eğitmeye başladığı an geldi. Nvidia, robotlara karmaşık motor becerileri öğretebilen Eureka adında bir yapay zeka ajanı geliştirdi.



Örneğin, Eureka robotik elle kalem döndürmeyi, yani parmaklarıyla sapla hızla hokkabazlık yapmayı öğretti. Elbette robot kolunun sanal bir modeli eğitildi, ancak bunun pek önemi yok.

Toplamda, Nvidia’nın yapay zeka temsilcisi robotlara dolap kapılarını açmak, top atmak ve yakalamak gibi yaklaşık 30 farklı görevi öğretti. Bu eylemlerin bazıları çok basit görünebilir ancak bunun nedeni, bunları otomatik olarak ve düşünmeden nasıl yapacağımızı bilmemizdir.

Eureka, GPT-4 dil modelini kullanır. Eğitimler Nvidia Isaac Gym fizik simülasyon uygulamasında gerçekleştirildi.

Takviyeli öğrenme son on yılda etkileyici ilerlemeler kaydetti ancak deneme yanılma süreci olarak kalan ödül tasarımı gibi birçok zorluk hala mevcut. Eureka, karmaşık sorunları çözmek için üretken ve pekiştirici öğrenme tekniklerini birleştiren yeni algoritmalar geliştirmeye yönelik ilk adımdır

Nvidia’nın yapay zeka aracısının verimliliğinin çok yüksek olduğunu belirtmekte fayda var. Basın bülteninde, Eureka’nın robotların deneme yanılma yoluyla öğrenmesine olanak tanıyan ödül programlarının, görevlerin %80’inden fazlasında uzmanlar tarafından yazılan programlardan daha iyi performans gösterdiği belirtildi. Bu, bot performansında ortalama %50’nin üzerinde bir artışla sonuçlanır.

Yapay zeka aracısı, takviyeli öğrenme için robotları ödüllendiren kod yazmak üzere GPT-4 dil modelini ve üretken yapay zekayı kullanıyor. Göreve özgü istemler veya önceden tanımlanmış ödül şablonları gerektirmez ve geliştiricinin vizyonuyla daha uyumlu sonuçlar üretmek amacıyla ödülleri değiştirmek için insanların geri bildirimlerini kolayca birleştirir.


Eureka, Isaac Gym’de GPU hızlandırmalı simülasyonu kullanarak, daha verimli bir eğitim için büyük ödül adayları gruplarının kalitesini hızlı bir şekilde değerlendirebilir. Eureka daha sonra eğitim sonuçlarından temel istatistiklerin bir özetini derler ve dil modeline ödül işlevlerinin oluşturulmasını iyileştirme talimatını verir. Böylece yapay zeka kendini geliştirir. Her türden robota (dört ayaklı, iki ayaklı, dört pervaneli robot, hünerli robotlar, manipülatör cobot’lar ve diğerleri) çeşitli görevleri yerine getirmeyi öğretti.



genel-22