
Microsoft araştırmacıları Çarşamba günü 3D oyun ortamları oluşturabilecek yeni bir yapay zeka (AI) modeli tanıttı. Dünya ve İnsan Eylem Modeli (WHAM) veya Muse olarak adlandırılan yeni AI modeli, teknoloji devinin araştırma oyunu zekası ve Xbox Games Studios’un ninja teorisi ile işbirliği içinde Teachable AI deneyimleri (Tai X) ekipleri tarafından geliştirildi. Şirket, büyük dil modelinin (LLM) oyun tasarımcılarına fikir uygulama sürecinde yardımcı olabileceğini ve oyun geliştiricilere yardımcı olmak için oyun görselleri ve denetleyici eylemleri oluşturmaya yardımcı olabileceğini söyledi.
Microsoft Muse AI modelini açıklıyor
Bir Blog yazısıRedmond merkezli teknoloji devi Muse AI modelini detaylandırdı. Bu şu anda bir araştırma ürünüdür, ancak şirket, Wham göstericisi için modelin ağırlıklarını ve örnek verilerini açık kaynaklı olduğunu söyledi (AI modeliyle etkileşime girmek için görsel bir arayüzün konsept prototipi). Geliştiriciler Azure AI Foundry’deki modeli deneyebilir. A kağıt Modelin teknik yönlerinin detaylandırılması Nature Journal’da yayınlanmıştır.
Böyle karmaşık bir alanda bir model eğitmek zor bir tekliftir. Microsoft araştırmacıları, Ninja Teorisi tarafından yayınlanan bir oyun olan 2020 Game Bleeding Edge’den büyük miktarda insan oyun verisi topladı. LLM, yedi yıllık insan oyununa eşdeğer bir milyar görüntü aksiyon çiftinde eğitildi. Verilerin etik olarak toplandığı ve yalnızca araştırma amacıyla kullanıldığı söylenir.
Araştırmacılar, model eğitimini ölçeklendirmenin büyük bir zorluk olduğunu söyledi. Başlangıçta, Muse NVIDIA V100 GPU kümesi üzerinde eğitildi, ancak daha sonra birden fazla NVIDIA H100 GPU’ya ölçeklendirildi.
İşlevselliğe gelen Muse AI modeli, görsel girişlerin yanı sıra metin istemlerini de kabul eder. Ayrıca, bir oyun ortamı oluşturulduktan sonra, denetleyici eylemleri kullanılarak daha da geliştirilebilir. Yapay zeka, kullanıcının ilk istem ile uyumlu yeni ortamlar ve oyunun geri kalanıyla tutarlı hale getirilmesi için yapılan hareketlere yanıt verir.
Benzersiz bir AI modeli olması nedeniyle, tipik kıyaslama testleri yeteneklerini düzgün bir şekilde değerlendiremez. Araştırmacılar, LLM’yi tutarlılık, çeşitlilik ve kalıcılık gibi metriklerde dahili olarak test ettiklerini vurguladılar. Araştırma odaklı bir model olduğundan, çıktılar sadece 300x180p çözünürlük ile sınırlıdır.

