OpenAI’deki uzmanlar, oynamak için bir sinir ağını eğitti Minecraft insan oyuncular kadar yüksek bir standarda.
Sinir ağı, 70.000 saatlik çeşitli oyun içi görüntüler üzerinde eğitildi ve küçük bir video ile desteklendi. veri tabanı yüklenicilerin belirli oyun içi görevleri gerçekleştirdiği videoların tuş takımı ve fare girişler de kaydedilir.
İnce ayardan sonra OpenAI, modelin yüzmeden hayvan avlamaya ve etlerini tüketmeye kadar her türlü karmaşık beceriyi gerçekleştirebildiğini buldu. Aynı zamanda, oyuncunun yükselme elde etmek için atlama ortasında altına bir malzeme bloğu yerleştirdiği bir hareket olan “sütun atlama” yı da kavradı.
Belki de en etkileyici olanı, AI, OpenAI’nin bir bilgisayar aracısı için “benzeri görülmemiş” bir başarı olarak tanımladığı elmas araçları (sırayla yürütülmesi gereken uzun bir dizi eylemi gerektiren) üretebildi.
Bir yapay zeka atılımı mı?
Minecraft projesinin önemi, şirketin “genel bilgisayar kullanan ajanların” gelişimini hızlandırabileceğini söylediği, Video PreTraining (VPT) olarak adlandırılan AI modellerinin eğitiminde OpenAI tarafından kullanılan yeni bir tekniğin etkinliğini göstermesidir.
Tarihsel olarak, yapay zeka modellerini eğitmek için bir kaynak olarak ham videoyu kullanmanın zorluğu şuydu: ne olduğunu anlamak için yeterince basit, ama mutlaka değil nasıl. Gerçekte, AI modeli istenen sonuçları emer, ancak bunlara ulaşmak için gereken girdi kombinasyonlarını kavrayamaz.
Ancak VPT ile OpenAI, temel modeli oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş, özenle seçilmiş bir görüntü havuzuyla halka açık web kaynaklarından alınan büyük bir video veri kümesini eşleştirir.
Ekip, temel modelde ince ayar yapmak için belirli görevleri öğretmek için tasarlanmış daha küçük veri kümelerini ekler. Bu bağlamda OpenAI, ağaçların kesilmesi ve zanaat masaları inşa edilmesi gibi erken oyun eylemlerini gerçekleştiren oyuncuların görüntülerini kullandı ve bunun modelin bu görevleri yerine getirebildiği güvenilirlikte “büyük bir gelişme” sağladığı söyleniyor.
Başka bir teknik, pekiştirmeli öğrenme olarak bilinen bir uygulama olan bir dizi görevdeki her adımı başarmak için AI modelini “ödüllendirmeyi” içerir. Bu süreç, sinir ağının insan düzeyinde bir başarı oranına sahip bir elmas kazma için tüm malzemeleri toplamasına izin verdi.
“VPT, acentelerin internetteki çok sayıda videoyu izleyerek hareket etmeyi öğrenmelerine izin vermenin yolunu açıyor. Üretken video modelleme veya yalnızca temsili öncelikler verecek olan karşılaştırmalı yöntemlerle karşılaştırıldığında, VPT, yalnızca dilden daha fazla alanda doğrudan büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici olasılığını sunuyor,” diye açıklıyor OpenAI. Blog yazısı (yeni sekmede açılır).
“Yalnızca Minecraft’ta deneyler yapıyor olsak da, oyun son derece açık uçlu ve yerel insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın, örneğin bilgisayar kullanımı gibi diğer benzer alanlar için iyiye işaret ettiğine inanıyoruz.”
Uzayda daha fazla deneyi teşvik etmek için OpenAI, MineRL NeurIPS yarışmasımüteahhit verilerini ve model kodunu karmaşık Minecraft görevlerini çözmek için AI kullanmaya çalışan yarışmacılara bağışladı. Büyük ödül: 100.000 dolar.