Dinamik ortamlarda Navigasyondaki AI potansiyelini vurgulayan Pokémon Go ile yapılan ilk deneylerden sonra, Kaliforniya Üniversitesi Hao Laboratuvarı’ndan araştırmacılar, bazı AI’nın uyarlama ve planlama becerilerini test etmek için Super Mario Bros Classic’i seçti. Geleneksel matematiksel ve mantıksal testler yerine, araştırmacılar kararlarını ve reaktif becerilerini, klasik retro oyununun taklit bir versiyonu aracılığıyla test ettiler, bu da AI’nın bir engel veya düşman yakınsa, oyunun ekran görüntüleri tarafından eşleştirilebileceği gibi, “bir engel veya düşman yakınsa, sola doğru hareket ettirin” gibi, “bir engel veya düşman, kaçmak için sola doğru hareket/atlama” gibi. Super Mario Bros’un içsel kolaylığına rağmen, Nintendo oyunu, öngörülemeyen bir ortama yenilmemek için karmaşık ve hızlı oyun stratejileri geliştirmek zorunda olan yapay zeka sistemleri için karmaşık bir zorluk olduğunu kanıtladı.
En iyisi (ve hayal kırıklığına uğrayanlar)
Test sonuçlarında beklenmedik hiyerarşiler ortaya çıktı. Claude 3.7, Pokemon’daki parlak oyun becerilerini zaten gösteren bir model Ai di hibrit akıl yürütmesi olan Antropic tarafından, kendini tartışmasız şampiyon olarak ayırt etti, en iyi oyuncunun değerli yansımalarını sergiledi, hassas sıçramaları birleştirdi ve düşmanlardan akıllıca kaçındı. Selefi Claude 3.5 bile mükemmel bir iş çıkardı. Sürpriz, sözde “akıl yürütme” modellerinden, yani Google’ın GPT-4O ve Gemini 1.5 Pro gibi akıl yürütmeye adanmış. Mantıksal ve karmaşık akıl yürütme becerilerine rağmen, oyunun hızlı tepki ihtiyaçları karşısında kendilerini zorluk içinde buldular, hareketlerini hesaplamak için çok fazla zaman ayırdılar. Yürütme hızının her şey olduğu bir oyunda akıl yürütmeyi cezalandıran bir mod.
Satrançtan Sanal Dünyalara: Yapay zeka için yeni bir meydan okuma
Yapay zekayı test etmek için retro video oyunlarının kullanılması, oyun becerileri üzerine bir test tezgahı olsa da, içerdiği her şeyle birlikte, San Diego araştırmacılarının deneyi, titiz bir değerlendirme metodolojisinden daha fazla keşif alıştırması olarak alınmalıdır. Bir AI’nın Super Mario Bros’un birinci seviyesinin üstesinden gelme yeteneği, gerçek dünyadaki farklı uygulamalarla ilgili olarak, sektördeki bazı uzmanları vurguladığı gibi, Super Mario’yu veya başka bir video oyunu oynama yeteneğinin AI modellerinin performansını analiz etmek için büyük bir güvenilirliğe sahip olmadığına ikna olmuşsa, sınırlı bir değere sahiptir. “Tepkim bir değerlendirme krizi olması. Şu anda hangi parametrelerin görüneceğini gerçekten bilmiyorum, “dedi ortak bir yazıda Openai’nin araştırmacısı ve kurucu üyesi Andrej Karpathy. Bununla birlikte, test, gerçek zamanlı olarak koordinasyon, uyarlanabilirlik ve kararlar gerektiren durumlarla yüzleşmek ve yönetimde yapay zeka becerileri hakkında ilginç fikirler sunmaktadır.
Gelecek: AI ve giderek daha karmaşık video oyunları
Super Mario Bros., AI’nın reaktivitesini ve adaptasyon kapasitesini değerlendirmek için bir ilk testi temsil ettiyse, bir sonraki zorluklar açık dünya video oyunlarını kullanarak veya sadece gerçek zamanlı olarak tepki vermekle kalmayıp aynı zamanda uzun vadeli taktikleri geliştirmek, kaynakları yönetmek ve öngörülemeyen senaryolara uyum sağlamak zorunda kalacakları karmaşık stratejik olabilir. Bu anlamda deneyler zaten yapılmıştır. Google DeepMind tarafından geliştirilen yapay zeka olan Alphastar, 2019’da zaten stratejik video oyunu stratejik II kompleksine egemen oldu ve büyük usta seviyesine ulaştı: tüm insan oyuncularının% 99,8’inin daha iyi bir sonucu. Alphastar’ı yenmek yeni nesil olacak mı? Zorluk açık.

