Google Araştırma bilim insanları, konuyla ilgili makalelerini yayınladılar OyunNGenorijinal içerikler üreten yapay zeka tabanlı bir oyun motorudur. Felaket sinir ağı üzerinde oyun. Kararlı Difüzyon kullanarak, bilim insanları Dani Valevski, Yaniv Leviathan, Moab Arar ve Shlomi Fruchter, GameNGen’i önceki kareleri ve oyuncunun mevcut girdisini işleyerek dünyada şaşırtıcı görsel doğruluk ve tutarlılıkla yeni kareler üretecek şekilde tasarladı.
Tutarlı mantıkla eksiksiz bir oyun motoru üreten AI benzersiz bir başarıdır. GameNGen’in Felaket gerçek bir video oyunu gibi oynanabilir, dönerek ve ateş ederek, silahları ateşleyerek ve düşmanlardan ve çevresel tehlikelerden doğru hasar vererek. Gerçek bir seviye, onu keşfederken gerçek zamanlı olarak etrafınızda inşa edilir. Hatta tabancanızın mühimmatının çoğunlukla kesin bir sayımını tutar. Çalışmaya göre, oyun 20 FPS’de çalışır ve kısa kliplerde gerçek Felaket oyun.
GameNGento’nun kendi eğitim modelini doğru bir şekilde modellemesi için gerekli tüm eğitim verilerini elde etmek için Felaket Google ekibi, ajan yapay zekasını oyun oynamak üzere eğitti Felaket tüm zorluklarda ve çeşitli oyuncu beceri seviyelerini simüle edin. Güçlendirmeleri toplamak ve seviyeleri tamamlamak gibi eylemler ödüllendirildi. Aynı zamanda, oyuncu hasarı veya ölümü cezalandırıldı ve oynayabilen ajanlar yaratıldı Felaket ve GameNGen modelinin referans alıp yeniden oluşturması için yüzlerce saatlik görsel eğitim verisi sağlamak.
Çalışmadaki önemli bir yenilik, bilim insanlarının Stable Diffusion’ı uzun süreler boyunca kullanırken kareler arasındaki uyumu nasıl koruduklarıdır. Stable Diffusion, görüntü veya metin istemlerinden görüntüler üreten ve 2022’deki lansmanından bu yana animasyonlu projelerde kullanılan yaygın bir üretken AI modelidir.
Stable Diffusion’ın animasyon için en önemli iki zayıflığı, kareden kareye tutarlılık eksikliği ve zamanla görsel sadakatte gerileme olmasıdır. Corridor’un Anime Rock Paper Scissors kısa filminde görüldüğü gibi, Stable Diffusion ikna edici durağan görüntüler yaratabilir ancak model ardışık kareler ürettiğinde titreme efektleri yaşar (gölgelerin kareden kareye oyuncuların yüzlerine nasıl sıçradığına dikkat edin).
Titreme, Stable Diffusion’ın çıktısını besleyerek ve karelerin birbirleriyle eşleşmesini sağlamak için oluşturduğu görüntüyü kullanarak eğiterek çözülebilir. Ancak, birkaç yüz kareden sonra, görüntü üretimi giderek daha az doğru hale gelir, bir fotokopiyi birçok kez fotokopi çekmenin etkisine benzer.
Google Research, bu sorunu, yeni çerçeveleri daha uzun bir kullanıcı girdileri dizisi ve onlardan önce gelen çerçevelerle eğiterek (sadece tek bir istem görüntüsü yerine) ve bu bağlam çerçevelerini Gauss gürültüsü kullanarak bozarak çözdü. Şimdi, ayrı ama bağlı bir sinir ağı, bağlam çerçevelerini düzelterek sürekli olarak kendini düzelten bir görüntü ve uzun süreler boyunca kalan yüksek düzeyde görsel kararlılık sağlıyor.
GameNGen’in şimdiye kadar görülen örnekleri, kabul etmek gerekir ki, mükemmel olmaktan uzak. Ekranda rastgele zamanlarda lekeler ve bulanıklıklar beliriyor. Ölü düşmanlar öldükten sonra bulanık yığınlara dönüşüyor. HUD’daki Doomguy, Monday Night Raw’daki The Rock gibi kaşlarını sürekli yukarı aşağı oynatıyor. Ve tabii ki, üretilen seviyeler en iyi ihtimalle tutarsız; yukarıdaki gömülü YouTube videosu, Doomguy’un %4’te aniden hasar almayı bıraktığı ve içinde 360 derece döndükten sonra düzenini tamamen değiştirdiği bir zehir çukurunda sonlanıyor.
Sonuç kazanılabilir bir video oyunu olmasa da GameNGen, oyunun etkileyici bir taklidini üretiyor. Felaket seviyoruz. Teknoloji demoları ve yapay zekanın geleceğine dair düşünce deneyleri arasında bir yerde, Google’ın GameNGen’i, alan devam ederse gelecekteki yapay zeka oyun geliştirmenin önemli bir parçası haline gelecektir. Caltech’in Minecraft’ı kullanarak yapay zeka modellerine tutarlı harita oluşturmayı öğretme araştırmasıyla birlikte, yapay zeka tabanlı video oyun motorları düşündüğümüzden daha erken bir zamanda size yakın bir bilgisayara gelebilir.