Google DeepMind’ın Yeni Yapay Zeka Ajanı: SIMA 2
Google DeepMind, geçtiğimiz günlerde SIMA 2’nin araştırma önizlemesini paylaştı. Bu yeni nesil genel amaçlı yapay zeka ajanı, dil ve mantık yeteneklerini birleştirerek, yalnızca talimatları takip etmekten öteye geçerek çevresiyle etkileşime geçebilen bir sistem sunuyor.
Geçmişten Günümüze: SIMA’nın Gelişimi
DeepMind projeleri arasında yer alan SIMA, ilk versiyonu SIMA 1 ile Mart 2024’te tanıtıldı. Bu ajan, yüzlerce saatlik video oyunu verisi üzerine eğitildi ve insan gibi birçok 3D oyunu oynayabilme yeteneği kazandı. Ancak SIMA 1’in karmaşık görevleri tamamlama başarısı yalnızca %31’de kalırken, insanlar bu tür görevlerde %71 başarı gösterdi.
DeepMind’ın kıdemli araştırma bilimcisi Joe Marino, SIMA 2 için “Bu, SIMA 1’in yeteneklerinde önemli bir adım ve iyileştirmenin bir göstergesi” dedi. “Daha genel bir ajan. Daha önce hiç görmediği ortamlarda karmaşık görevleri tamamlayabilir. Kendi deneyimlerine dayanarak kendini geliştirebilir.”
SIMA 2’nin Yenilikçi Özellikleri
SIMA 2, Gemini 2.5 modelinden güç alıyor. AGI (Yapay Genel Zeka) terimi, geniş bir entelektüel görevi yerine getirme yeteneğine sahip ve yeni beceriler öğrenebilme kapasitesini tanımlıyor. DeepMind araştırmacıları, “bedensel ajanlarla” çalışmanın genel zeka için kritik olduğunu belirtiyor.
Bir bedensel ajanın, fiziksel veya sanal bir dünya ile etkileşime geçerek girişleri gözlemlediği ve insan ya da robot gibi hareket ettiği ifade ediliyor. Marino, SIMA 2’nin yalnızca oyun oynamaktan çok daha ileri gittiğini belirtiyor. “Kullanıcının ne istediğini anlaması ve buna sağlıklı bir yanıt verebilmesi gerekiyor ki bu oldukça zordur,” diyor.
Görev Tamamlama Yeteneği: Kendini Geliştirme ve İleri Düzey Mantık
Gemini entegrasyonu sayesinde, SIMA 2, öncekine göre performansını iki katına çıkardı ve gelişmiş dil ve mantık yeteneklerini bedensel becerilerle birleştirdi.
SIMA 2, “No Man’s Sky” oyununda demo edildi. Ajan, çevresini tanımlarken, bir yardım işaretini tanıyarak nesnelerle etkileşime geçti. Aynı zamanda, bir evin niteliklerine göre mantık yürütme becerisini gösterdi. Örneğin, “tomatoya renk olarak sahip olan eve git” talimatıyla, “yorumlanmış olan tomatolar kırmızıdır, bu nedenle kırmızı eve gitmeliyim” diyerek hedefe yöneldi.
Gemini ile beraberlik, SIMA 2’nin emoji tabanlı talimatları takip etmesini de sağlar. Örneğin, “🪓🌲” emoji kombinasyonu verilirse, ajan bunu anlayarak ağaç kesmeye yöneliyor.
Yeni Ortamlarda Başarı ve Uygulamalar
SIMA 2, Genie modeli tarafından üretilen fotorealist yeni dünyalarda da gezinme yeteneği gösteriyor. Ajan, banklar, ağaçlar ve kelebeği doğru bir şekilde tanıyıp onlarla etkileşime geçebiliyor.
SIMA 2’nin kendini geliştirme yeteneği, çok az insan verisiyle mümkün oluyor. SIMA 1, tamamen insan oyunuyla eğitilmişken, SIMA 2 bu eğitimi bir başlangıç olarak kullanıyor. Yeni bir ortama girdiğinde, başka bir Gemini modeli, yeni görevler üretmek için devreye giriyor ve ajanın denemelerini değerlendiren ayrı bir ödül modeli ile değerlendiriliyor. Bu öz-oluşturulmuş deneyimleri eğitim verisi olarak kullanarak, ajan kendi hatalarından ders alıyor ve zamanla kendini geliştirebiliyor.
Geleceğe Dair Vizyonlar
DeepMind, SIMA 2’yi daha genel amaçlı robotların kilidini açma aşaması olarak görüyor. Kıdemli mühendis Frederic Besse, “Gerçek dünyada görevleri yerine getirme yetenekleri açısından iki temel bileşen var: Yüksek düzeyde gerçek dünya anlayışı ve yapılması gerekenler ile ilgili mantık yürütme,” dedi.
Bir insansı robotun evdeki dolaba gitmesini söylediğinizde, sistemin ne olduğunu anlayabilmesi için kavramları doğru algılaması gerekiyor. Besse, SIMA 2’nin daha yüksek düzey davranışları ele aldığını ifade ediyor.
SIMA 2’nin fiziksel robot sistemlerinde uygulanması için bir zaman çizelgesi paylaşılmadı. Ancak, DeepMind son zamanlarda duyurduğu robotik temel modelin, fiziksel dünyayı mantık yürütebilme ve çok adımlı planlar oluşturabilme yeteneği ile SIMA’dan farklı olarak eğitildiğini belirtiyor.
SIMA 2’nin potansiyel uygulamaları hakkında daha fazla bilgi paylaşılmasa da, DeepMind’ın amacı bu teknoloji ile ne tür iş birlikleri ve imkanların mümkün olabileceğini göstermek.


