
Google DeepMind, Çarşamba günü sonsuz 2D oyun dünyaları yaratabilen Genie yapay zeka (AI) modelinin halefini tanıttı. Genie 2 olarak adlandırılan yeni yapay zeka modeli, tek bir görüntü istemine dayalı benzersiz, aksiyonla kontrol edilebilen, oynanabilir 3D ortamlar oluşturma kapasitesine sahip. Genie 2’yi bir yapay zeka “dünya modeli” olarak adlandıran şirket, tutarlı nesnelerle dakikalarca süren ortamlar oluşturabildiğini belirtti. Şirket, oluşturulan bu dünyaların insanlar tarafından oynanabileceğini veya yapay zeka ajanlarını eğitmek için kullanılabileceğini söyledi.
Google DeepMind, Genie 2 Yapay Zeka Modelini Açıkladı
bir blog yazısıŞirket, yeni yapay zeka modelini ve yeteneklerini ayrıntılarıyla anlattı. Önceki model yalnızca 2 boyutlu platform oyunları için oyun dünyaları oluşturabiliyorken Genie 2 yapay zeka modeli, etkileşime girilebilecek tutarlı modellerle tamamlanmış 3 boyutlu dünyalar oluşturabiliyor. Bu, insanların veya yapay zeka ajanlarının bu ortamlarda yürüyebileceği, koşabileceği, yüzebileceği, tırmanabileceği ve daha fazla eylem gerçekleştirebileceği anlamına geliyor.
Genie 2’nin üretken yetenekleri, giriş görüntüsünde görülemeyen rotalar, binalar ve nesneler oluşturmasına olanak tanır. Bu öğeler model tarafından sıfırdan tasarlanmış ve işlenmiştir. Ayrıca temel modeli bu ortamlarda tutarlılığı da koruma kapasitesine sahiptir. Bu, bir oyuncu bir alandan uzaklaşıp geri döndüğünde bile ortamların aynı kalacağı anlamına gelir.
Bunun dışında Genie 2, birinci şahıs bakış açıları, izometrik görüşler veya üçüncü şahıs bakış açıları gibi farklı perspektifler oluşturma yeteneğine sahiptir. Ayrıca kullanıcılar, oluşturulan dünyalardaki nesnelerle etkileşime girebiliyor ve kapı açma, balon patlatma veya merdivene tırmanma gibi eylemleri gerçekleştirebiliyor. Model ayrıca su dalgaları, duman, yerçekimi, yönlü aydınlatma, yansımalar ve daha fazlası gibi fizikle ilgili efektler üretmeye de yönlendirilebilir.
Teknik detaylara gelecek olursak DeepMind, Genie 2’nin otoregresif bir gizli difüzyon modeli olduğunu ve büyük bir video veri seti üzerinde eğitildiğini açıkladı. Transformatör mimarisi ayrıca bu dünyaların kare kare oluşturulmasını sağlayan bir otomatik kodlayıcı içerir.
Özellikle DeepMind, bu yılın başlarında Ölçeklenebilir Eğitilebilir Çoklu Dünya Aracısı veya SIMA olarak adlandırılan ve esas olarak 3 boyutlu dünyalarda ajansal yapay zeka işlevlerini yerine getirebilen bir yapay zeka modeli yayınladı. Şirket, Genie 2’nin benzer yapay zeka aracılarına benzersiz ortamlar sağlama ve onları çeşitli gerçek hayat senaryoları için eğitme kapasitesine sahip olduğunu söylüyor.
Dünya modeli benzersiz ortamlar oluşturabildiğinden Google, bunun veri kirliliği riskini ortadan kaldıracağını ve geliştiricilerin bir AI aracısının yeteneklerini doğru şekilde değerlendirmesine olanak sağlayacağını söylüyor.

