DeepMind'ın Yeni Yapay Zekası 'Stratego'da İnsanları Ezmek İçin Oyun Teorisini Kullanıyor başlıklı makale için resim

Ekran görüntüsü: Derin Düşünce

İnsanlar, AI tarafından tamamen yenilmeden hala oynayabileceğimiz masa oyunlarını hızla tüketiyor. Geçmişte, Araştırmacılar, AI’nın insanları en iyi şekilde kullanma yeteneğini gösterdi. satranç, Gitmekve son zamanlarda, diplomasi. Şimdi, strateji oyunu Stratego’yu şimdiye kadarkilere ekleyebilirsiniz.büyüyen liste

Alphabet’ten araştırmacılar-Gizmodo ile paylaşılan yeni araştırmaya göre DeepMind’ın sahibi, Stratego’yu “insan uzman seviyesinde” oynayabilecek yeni bir yapay zeka ajanı yarattıklarını söylüyor. DeepNash adlı AI, diğer AI’lara karşı oynadığı maçların neredeyse tamamını kazandı ve Çevrimiçi oyunlarda insan oyunculara karşı yarışırken genel olarak %84 kazanma oranı. Oyunda ustalaşmayı kendisine karşı oynayarak öğrenen DeepNash, önceki yapay zeka sistemlerinin yapamadığı “olağanüstü” şekillerde karmaşık kararlar verebiliyor ve takasları değerlendirebiliyordu.

Stratego başlangıçta bir yapay zekayı eğitmek için en bariz örnek gibi görünmese de, araştırmacılar oyunun kombinasyonunun daha uzun olduğunu söylüyorlar.vadeli karar verme ve kusurlu bilgilerin kusurlu akışı, onu benzersiz bir test ortamı haline getirir. Oyun genellikle iki oyuncu tarafından oynanır ve hem strateji hem de aldatma içerir. Oyuncuların her biri kendi değerlerine sahip parçalardan oluşan kendi “ordularına” sahiptir. Oyuncular, rakibin bayrağını ele geçirerek veya tüm hareketli taşlarını ele geçirerek kazanır.

Farklı değerlere sahip bu taşların tümü, son derece büyük miktarda olası hamle ve sonuçla sonuçlanır. Araştırmacılar, Stratego’nun Texas Hold’em pokerden çok daha fazla “olası duruma” sahip olduğunu ve hatta çoğu zaman çok çeşitli olası seçeneklerle müjdelenen Go’dan daha fazla olduğunu söyledi.

DeepNash kazanmak için hem uzun vadeli stratejiyi hem de blöf yapma ve risk alma gibi kısa vadeli karar vermeyi karıştırdı. Bu şeylerden ikisinin bir yapay zeka ajanı tarafından aynı anda bu kadar iyi bir şekilde yapılabilmesi nadirdir. Stratego’nun uzun, stratejik düşünme ve dayalı kararlar verme kombinasyonu eksik veya sınırlı bilgi çoğunlukla geçmiş AI modellerini engelledi.

Araştırmacı, “DeepNash, bilgi ve malzeme arasında önemsiz olmayan ödünleşimler yapabildi, blöfler yaptı ve gerektiğinde kumar oynadı” dedi.yazmak.

Derin Nash Amerikalı matematikçiden etkileniyor gibi görünüyor John Nash diğer şeylerin yanı sıra, Nash Dengesini icat eden kişi. Özetle, bu denge, oyun teorisinde, her iki rakibin de karşı karşıya geldiği ve artık ilk stratejilerinden sapmak için herhangi bir teşvike sahip olmadığı bir çözümü ifade eder. Pek çok olası senaryo arasında, oyun teorisindeki Nash dengesi genellikle “en uygun” sonuç olarak kabul edilir.

DeepNash özünde, Stratego oyunlarında Nash dengesini bulmaya çalışır.kendi kendine oynama ve modellemenin yeni kombinasyonu“R-NaD” adı verilen ücretsiz pekiştirme algoritması öğrenimi. Araştırmacılar hem bu algoritmayı hem de derin sinir ağı mimarisini kullanarak son derece karmaşık durumlarda bile kazanan bir bot yaratmayı başardılar. DeepNash, Stratego’da rekabet etmek için eğitilmiş olsa da, DeepMind bir oyun teorisi dehası yaratmış gibi görünüyor.

Araştırmacılar, DeepNash’i çevrimiçi oyun platformu Gravon’da diğer botlara ve “en iyi insan oyunculara” karşı karşıya getirerek test etti. DeepNash, botlara karşı minimum %97’lik bir kazanma oranı elde etti. İnsanlara karşı performansı, %84’lük genel kazanma oranıyla yalnızca biraz daha kötüydü. AI, yılbaşından bu yana her ikisinde de ilk üç oyuncu arasında yer aldı. ve tüm zamanların liderlik tablosu.

Araştırmacılar, “Bildiğimiz kadarıyla, bu, bir yapay zeka algoritmasının Stratego oynamayı insan uzman düzeyinde ilk kez öğrenebilmesidir” dedi.



genel-7