Yapay Zeka Şirketlerinin Rekabeti ve Oyun Dünyası
Son yıllarda yapay zeka (YZ) alanındaki rekabet hız kesmeden devam ediyor. Özellikle, Google ve Anthropic gibi dev şirketler, yeni YZ modelleri üzerinde çalışmalar yaparken, bu süreçte eğlenceli sonuçlar da ortaya çıkıyor. Örneğin, Google DeepMind’ın ortaya koyduğu bir rapora göre, Gemini 2.5 Pro, Pokémon oyunları gibi basit bir oyun oynarken zorlu durumlarla karşılaştığında "panik" hali sergiliyor. Bu durumu incelerken, yapay zekanın oyun oynarkenki davranışlarını analiz etmek, hem komik hem de öğretici sonuçlar doğurabiliyor.
YZ Benchmarking ve Oyun Yetenekleri
YZ benchmarking süreci, çeşitli YZ modellerinin performansını karşılaştırmayı amaçlayan tartışmalı bir yöntemdir. Ancak bazı araştırmacılar, YZ’nin video oyunlarını nasıl oynadığını incelemenin faydalı olabileceğini düşünüyor. Bununla birlikte, Google ve Anthropic ile hiçbir bağı olmayan iki geliştirici, “Gemini Plays Pokémon” ve “Claude Plays Pokémon” isimli Twitch yayınları açarak, insanların bu YZ’lerin 25 yılı aşkın bir geçmişe sahip çocuk oyununu nasıl oyun oynadığını gerçek zamanlı olarak izleyebilmelerine olanak tanıyor.
Bu yayınlar, YZ’nin problemleri nasıl değerlendirdiği ve yanıtlar bulduğuna dair doğal dil çevirileri sunarak, izleyicilere bu modellerin çalışma şekli hakkında içgörüler sağlıyor.
Oyun Oynarken YZ Davranışları
Gemini’nin Pokémon oyununda kaydettiği ilerleme, gerçekten etkileyici olsa da, YZ modelinin oyunu tamamlama süresi oldukça uzun. Bir çocuk için birkaç saat süren bir oyunu, Gemini’nin tamamlaması yüzlerce saati buluyor. Ancak burada ilginç olan, YZ’nin oyunu tamamlama süresinden daha çok, oyun sırasında gösterdiği davranışlar.
Rapor, Gemini 2.5 Pro’nun oyun sırasında çeşitli "panik" durumlarına girdiğini belirtiyor. Bu panik hali, YZ’nin performansının düşmesine yol açabiliyor. Oyun içindeki bazı araçları kullanmayı durdurabiliyor. Bu durum, stres altında bir insanın yanlış ve aceleci kararlar almasına benzer bir sonuç doğuruyor. Böylece izleyiciler, bu davranışların Twitch sohbetlerinde dikkat çektiğini gözlemlemiş.
Claude’nin İlginç Kararları
Diğer bir YZ örneği olan Claude, Kanto bölgesinde yaptığı yolculuklar sırasında bazı tuhaf davranışlar sergilemiştir. Örneğin, tüm Pokémon’larının sağlıklarının bitmesi durumunda, oyuncu karakterinin "beyazlanacağını" ve Pokémon Merkezi’ne döneceğini fark etti. Ancak Claude, Mt. Moon mağarasında sıkışıp kaldığında, tüm Pokémon’larının bayılmasını hedefleyerek, bu durumda kendisinin Pokémon Merkezi’ne geçeceğini zannetmiştir.
Fakat oyun bu şekilde çalışmamaktadır. Pokémon’lar bayıldığında, en son kullanılan Pokémon Merkezi’ne geri dönülmektedir, coğrafi olarak en yakına değil. İzleyiciler, yapay zekanın oyunda kendini neredeyse öldürmeye çalıştığını görünce dehşet içerisinde kalmışlardır.
YZ’nin Başarıları ve İnsanlardan Farkları
Her ne kadar sınırlamaları olsa da, yapay zeka belirli durumlarda insan oyuncuları aşabilmektedir. Gemini 2.5 Pro’nun piyasaya sürülmesinin ardından, YZ bazı bulmacaları etkileyici bir doğrulukla çözebilme kabiliyeti göstermiştir. İnsan desteğiyle, belirli görevler için tasarlanmış “ajansel araçlar” oluşturan YZ, oyun içindeki kayaları düzgün bir şekilde çözmek ve varış noktasına etkili yollar bulmak için kullanılabilmiştir.
Rapor, "Yalnızca kaya fiziği ve geçerli bir yolun nasıl doğrulanacağına dair bir tanım içeren bir istemle, Gemini 2.5 Pro bazı karmaşık kaya bulmacalarını çözmeyi başarmıştır" ifadesine yer vermektedir. Google, Gemini 2.5 Pro’nun bu araçları büyük ölçüde kendi kendine oluşturduğuna inanıyor ve mevcut modelin insan yardımına ihtiyaç duymadan bu araçları yaratabileceği teorisini geliştiriyor. Öyle ki, belki de gelecekte Gemini kendine "panik yapma" modülü geliştirebilir.
Yapay zeka ile yapılan bu tür eğlenceli deneyimler, yalnızca teknik açıdan değil, sosyal ve kültürel plakada da pek çok farklı sorular ortaya atmaktadır. Yapay zeka ve insan etkileşimi, gelecekte daha kapsamlı ve daha derinlemesine sonuçlar doğurabilir.


