DeepMind'ın Yeni Yapay Zekası Stratego'da İnsanları Ezmek İçin Oyun Teorisini Kullanıyor - Dünyadan Güncel Teknoloji Haberleri

DeepMind'ın Yeni Yapay Zekası 'Stratego'da İnsanları Ezmek İçin Oyun Teorisini Kullanıyor başlıklı makale için resim — Ekran görüntüsü: Derin Düşünce

İnsanlar, AI tarafından tamamen yenilmeden hala oynayabileceğimiz masa oyunlarını hızla tüketiyor. Geçmişte, Araştırmacılar, AI’nın insanları en iyi şekilde kullanma yeteneğini gösterdi. satranç, Gitmekve son zamanlarda, diplomasi. Şimdi, strateji oyunu Stratego’yu şimdiye kadarkilere ekleyebilirsiniz.büyüyen liste

Alphabet’ten araştırmacılar-Gizmodo ile paylaşılan yeni araştırmaya göre DeepMind’ın sahibi, Stratego’yu “insan uzman seviyesinde” oynayabilecek yeni bir yapay zeka ajanı yarattıklarını söylüyor. DeepNash adlı AI, diğer AI’lara karşı oynadığı maçların neredeyse tamamını kazandı ve Çevrimiçi oyunlarda insan oyunculara karşı yarışırken genel olarak %84 kazanma oranı. Oyunda ustalaşmayı kendisine karşı oynayarak öğrenen DeepNash, önceki yapay zeka sistemlerinin yapamadığı “olağanüstü” şekillerde karmaşık kararlar verebiliyor ve takasları değerlendirebiliyordu.

Stratego başlangıçta bir yapay zekayı eğitmek için en bariz örnek gibi görünmese de, araştırmacılar oyunun kombinasyonunun daha uzun olduğunu söylüyorlar.vadeli karar verme ve kusurlu bilgilerin kusurlu akışı, onu benzersiz bir test ortamı haline getirir. Oyun genellikle iki oyuncu tarafından oynanır ve hem strateji hem de aldatma içerir. Oyuncuların her biri kendi değerlerine sahip parçalardan oluşan kendi “ordularına” sahiptir. Oyuncular, rakibin bayrağını ele geçirerek veya tüm hareketli taşlarını ele geçirerek kazanır.

Farklı değerlere sahip bu taşların tümü, son derece büyük miktarda olası hamle ve sonuçla sonuçlanır. Araştırmacılar, Stratego’nun Texas Hold’em pokerden çok daha fazla “olası duruma” sahip olduğunu ve hatta çoğu zaman çok çeşitli olası seçeneklerle müjdelenen Go’dan daha fazla olduğunu söyledi.

DeepNash kazanmak için hem uzun vadeli stratejiyi hem de blöf yapma ve risk alma gibi kısa vadeli karar vermeyi karıştırdı. Bu şeylerden ikisinin bir yapay zeka ajanı tarafından aynı anda bu kadar iyi bir şekilde yapılabilmesi nadirdir. Stratego’nun uzun, stratejik düşünme ve dayalı kararlar verme kombinasyonu eksik veya sınırlı bilgi çoğunlukla geçmiş AI modellerini engelledi.

G/O Media komisyon alabilir

Araştırmacı, “DeepNash, bilgi ve malzeme arasında önemsiz olmayan ödünleşimler yapabildi, blöfler yaptı ve gerektiğinde kumar oynadı” dedi.yazmak.

Derin Nash Amerikalı matematikçiden etkileniyor gibi görünüyor John Nash diğer şeylerin yanı sıra, Nash Dengesini icat eden kişi. Özetle, bu denge, oyun teorisinde, her iki rakibin de karşı karşıya geldiği ve artık ilk stratejilerinden sapmak için herhangi bir teşvike sahip olmadığı bir çözümü ifade eder. Pek çok olası senaryo arasında, oyun teorisindeki Nash dengesi genellikle “en uygun” sonuç olarak kabul edilir.

DeepNash özünde, Stratego oyunlarında Nash dengesini bulmaya çalışır.kendi kendine oynama ve modellemenin yeni kombinasyonu“R-NaD” adı verilen ücretsiz pekiştirme algoritması öğrenimi. Araştırmacılar hem bu algoritmayı hem de derin sinir ağı mimarisini kullanarak son derece karmaşık durumlarda bile kazanan bir bot yaratmayı başardılar. DeepNash, Stratego’da rekabet etmek için eğitilmiş olsa da, DeepMind bir oyun teorisi dehası yaratmış gibi görünüyor.

Araştırmacılar, DeepNash’i çevrimiçi oyun platformu Gravon’da diğer botlara ve “en iyi insan oyunculara” karşı karşıya getirerek test etti. DeepNash, botlara karşı minimum %97’lik bir kazanma oranı elde etti. İnsanlara karşı performansı, %84’lük genel kazanma oranıyla yalnızca biraz daha kötüydü. AI, yılbaşından bu yana her ikisinde de ilk üç oyuncu arasında yer aldı. ve tüm zamanların liderlik tablosu.

Araştırmacılar, “Bildiğimiz kadarıyla, bu, bir yapay zeka algoritmasının Stratego oynamayı insan uzman düzeyinde ilk kez öğrenebilmesidir” dedi.

genel-7

DeepMind’ın Yeni Yapay Zekası Stratego’da İnsanları Ezmek İçin Oyun Teorisini Kullanıyor

Byteknomers

By teknomers

Benzer İçerikler

AMD sonunda Zenbleed güvenlik açığını kapattı — MSI, Zen 2 için AGESA 1.2.0.Ca BIOS güncellemesini yayınladı

TechCrunch Dakikası: CZ’nin cezasının kripto durumunu terk ettiği yer

Tales of the Empire, Birbirinden Çok Farklı 2 Yarıdan Oluşan Bir Hikayedir

Persona 3 Yeniden Yükleme Güncellemesi 1.04, 2 Mayıs’ta Ara Sahne Sorununu Düzeltiyor

Moon Studios, Wicked İçin Dinlenme Yok ve DLSS ve FSR Uygulaması Konusunda Güncelleme Sağlıyor

Bu sessiz özel PC klavyesinin maliyeti iki Nvidia RTX 4090’dan fazla

Breath of the Wild’dan Zelda Nendoroid Stoklara Geri Döndü ve Amazon’da İndirimli

Huawei’nin kamera merkezli Pura 70 serisi dünyaya açılıyor

Google Arama, yalnızca bir hafta içinde ChatGPT ile rekabet edebilir

Circle to Search, beta test kullanıcıları için Pixel Tablet’te kullanıma sunulmaya başlıyor

Google Mesajlar yanıt hatırlatıcılarını ve doğum günü özelliklerini kaybediyor

Gökbilimciler FU Orionis’in Dramatik Patlamasının 1936 Gizemini Çözüyor

Japon havacılık şirketi uzay enkazının gerçek bir resmini yakaladı

Ay Görevi İçin Elektromanyetik Testleri Tamamladı

İki küçük NASA uydusu toprak nemini ve volkanik gazları ölçecek

İlginizi Çekebilir

AMD sonunda Zenbleed güvenlik açığını kapattı — MSI, Zen 2 için AGESA 1.2.0.Ca BIOS güncellemesini yayınladı

TechCrunch Dakikası: CZ’nin cezasının kripto durumunu terk ettiği yer

Uzun Dalga Boyları için Büyük Gözlemevi (GO-LoW) önerisi

Tales of the Empire, Birbirinden Çok Farklı 2 Yarıdan Oluşan Bir Hikayedir