TikTo’da“Benimle hazırlanın” videoları, hayat tüyoları ve memler arasında birkaç robot, çoğumuzun hayatımızın bir noktasında karşılaştığımız bir zorluk üzerinde çalışıyor: dayak atmak. Süper Mario Dünyası. Geçtiğimiz hafta boyunca kullanıcılar canlı yayın AI’lar Mario oynamayı öğrenmeye çalışıyor ve özellikle bir robot, harika gidiyor. Adı Rupert ve az önce 2. seviyeyi geçti.

Yapay zekanın stratejisi, ilk kez bir Super Nintendo kumandasını kullandığını hatırlayan herkese tanıdık gelecektir. Rupert tekrar tekrar koşar, zıplar, düşmanlara çarpar, uçurumlardan düşer ve ölür. Her öldüğünde, Rupert tekrar denedi. Genellikle son turda onu öldüren hamlelerin neredeyse aynısını yapar. Ancak yeterince uzun süre izlerseniz Rupert’ın geliştiğini fark edeceksiniz. daha iyi olmak. BT’öğreniyor.

Gerçek adının kullanılmamasını isteyen Rupert’tan sorumlu TikTok kullanıcısı PCMasterRace’e katılın, “Bu, sinir ağlarıyla doğal seçilimi simüle etmek için yapılmış bir program” dedi. (PCMasterRace, masaüstü bilgisayarlarla ilgili bir alt dizinin sakıncalı adıdır.)

Başka bir deyişle Rupert, kendi hatalarını izleyerek daha iyi hale gelen bir makine öğrenimi algoritmaları sistemidir. Rupert’ın belirlenmiş bir hedefi var: seviyenin diğer ucuna ulaşmak. Hangi tuşlara basabileceğini biliyor ve ekranda neler olduğunu görebiliyor. (Aslında Rupert’ın “gördüğünü” görebilirsiniz.Aşağıdaki videonun sol üst köşesinde “s” görünür.) Ancak bir insan Mario operatörünün aksine, bir yapay zeka, Koopas’tan kaçınması veya bir çıkıntıdan düşmemeye çalışması gerektiğine dair varsayımlarda bulunamaz. Rupert’ın sahip olduğu tek şey olumlu ve olumsuz geri bildirimler. Aslında Rupert her şeyi rastgele dener. Neyin işe yarayıp yaramadığını hatırlar ve stratejisi zamanla gelişir.

Rupert “Türler” ve “nesiller” kullanılarak çalışması anlamında evrimden sonra modellenmiştir. Yapay zeka her tür için yaklaşık iki ila altı çalışma süren belirli bir strateji dener. Yapay zeka, her 50-100 tür için öğrendiklerini bir “nesil” halinde topluyor.

Yapay zeka oynadıkça bir “uygunluk” puanı alır. Kondisyon ne kadar uzağa bağlı olarak artar Mario sağa gider ve o kadar hızlı olur oraya varır. Daha yüksek kondisyona sahip nesiller, gelecek nesiller için “yetiştirilmek” üzere seçiliyor; bu, yapay zekanın işe yarayan davranış ve kalıpların üzerine inşa edildiği ve yeniden başladığı anlamına geliyor. Bu, karar verme sürecinin zaman içinde daha karmaşık ve karmaşık hale gelmesine olanak tanır.

Yavaş ilerliyor ama işe yarıyor. Rupert’ın birinci seviyeyi geçmesi yalnızca 57 nesil sürdü ve izleyiciler Rupert’ın başarısını alkışlarken yorumlarda kutlamalara yol açtı.

Rupert, sevgiyle anılan başka bir TikTok yayın yapan AI Mario oyuncusuyla birlikte George, MarI/O adında açık kaynaklı bir program çalıştırıyor. Kodlayıcı ve canlı yayıncı Seth Hendrickson tarafından yapıldı. SethBling çevrimiçi. MarI/O yeni değil. Hendrickson bunu yıllar önce yayınladı ancak robotun entrikaları, teknoloji endüstrisinin bizden yapay zekanın yakında kontrolü ele alacağına inanmamızı istediği bir çağda yeniden önem kazandı Dünya.

MarI/O, ChatGPT gibi bir sistemden çok daha basittir, ancak bunun nasıl yapılacağına dair bir penceredir. Yapay zeka modelleri . Bu yapay zeka araçları bir nevi spagettiyi duvara fırlatıyor ve insanlar bu girişimin bir öncekinden daha iyi mi yoksa daha kötü mü olduğunu onlara söyleyecek sistemler tasarlıyor. Zaman geçtikçe girişimler daha iyi hale gelir. Şimdi bunun milyonlarca, milyarlarca kez gerçekleştiğini hayal edin. Hendrickson’un videolarından birinde daha ayrıntılı bir açıklayıcı görebilirsiniz:

MarI/O – Video Oyunları için Makine Öğrenimi

İle ChatGPT katlanarak daha karmaşık hale geliyor. MarI/O’nun çok fazla seçeneği yok: sol, sağ, yukarı, aşağı, A, B, X ve Y. Öte yandan İngilizce dilinde yüzbinlerce kelime ve sayısız yol var. bu kelimeleri ve teorik olarak sonsuz sayıda fikri düzenleyin. MarI/O, ChatGPT’den çok daha basittir—ve teknoloji temelde farklıdır— ancak MarI/O’nun nasıl çalıştığını anlarsanız, Chatbot teknolojisini faydalı bir şekilde anlamak için bunu tahmin edebilirsiniz.

Ne yazık ki Rupert sadece küçük bir adam. Elinden gelenin en iyisini yapıyor ama Rupert oyunda ilerledikçe sorun yaşayacak. MarI/O’nun sistemi yalnızca Mario’nun ekranın sağına ne kadar ilerlediğine bağlı olarak kendisini ödüllendirir, ancak Super Mario dünyasında bazı seviyelerde hedefe ulaşmak için sağa gitmek yerine yukarı tırmanmanız gerekir.

PCMasterRace’e katılın, “Ancak dikey yapılara daha iyi tırmanabilmesi için onu değiştirmeyi planlıyorum” dedi.



genel-7