Hepimiz Google Haritalar’daki Sokak Görünümü’nü açıp çocukluğumuzun evinin görünümünü arkadaşlarımıza gösterdik. Ya da Paris’teki otelimizin hangi mahallede olduğunu görmek için o küçük insan simgesini sokağa bıraktık. Ama şimdi bunu daha sürükleyici ve etkileşimli bir şekilde yapabileceğimizi düşünün; sokağı ve çevresini gerçekten simüle edebilir, hava durumunu ayarlayabilir veya “Yarından Sonra” senaryosunda nasıl görüneceğini görebiliriz.
Google’ın son entegrasyonunun hedeflerinden biri bu. Bugün itibarıyla Google DeepMind, Sokak Görünümü’nü, farklı ve etkileşimli ortamlar oluşturabilen genel amaçlı dünya modeli Project Genie ile birleştiriyor. Yeni özellik, Google I/O geliştirici konferansında tanıtıldı.
Jack Parker-Holder, DeepMind’ın açık uçluluk ekibindeki araştırma bilimcisi, “Bu hem ajans [ve robotik] kullanımı hem de insanların oynayabilmesi için gerçekten güçlü ve Genie’nin temel tezi her zaman bu olmuştur” dedi.
Örneğin, Londra’da konuşlandırılan ve nadiren güneş gören bir robotu ele aldı. Parker-Holder, Genie’nin, Victoriyen tarzı evlerin üzerine güneşin yansıdığı nadir durumları simüle edebileceğini belirtti. Böylece robot, bu durumla karşılaştığında şaşırmaz.
“Aynı zamanda, ‘New York Şehrine gidiyorum ama bu mevsimde değil’ diyebilirsin,” diye devam etti. “‘Kar yağacak. O sokağın karla nasıl göründüğünü görmek istiyorum.’”
Google, 20 yıldır Sokak Görünümü verilerini, kameralarla donatılmış araçlar ve “izleyici sırt çantası” taşıyan bireyler aracılığıyla topluyor. Teknoloji devi, 110 ülkede ve yedi kıtada 280 milyar görüntüden fazla veri topladı.
Jack, “Sokak Görünümü ile dünyanın büyük bir kısmına ait görüntülere sahibiz. Bu zengin gerçek dünya bilgisi ve verilerini simüle etme yeteneği ile birleştirmenin ne kadar güçlü olabileceğini hayal edebilirsin” dedi.
Google, en son dünya modeli Genie 3’ü geçen Ağustos ayında bir araştırma önizlemesi olarak tanıttı ve aracı Ocak ayında Amerika’daki Google AI Ultra abonelerine erişime açtı. Kullanıcılar, metin istemleri veya görsellerden etkileşimli oyun dünyaları oluşturabiliyor. Amaç, Genie’yi eğitim deneyimleri, oyun ve robotik eğitimi için kullanmak.
Genie 3, Waymo’nun kendiliğinden giden araçlarını “son derece nadir olaylar” olan kasırgalar veya sıradan fil karşılaşmaları gibi konularda eğitmek için kullanılan bir simülatörü destekliyor. Sokak Görünümü verilerinin eklenmesi, Waymo’nun dünya genelindeki daha fazla şehirde faaliyete geçmesine yardımcı olabilir.
Waymo, AI sürücüsünü birkaç daha fazla şehirde test etmek için 11 ABD şehrine ölçeklenmeyi sağlamak amacıyla kendi simülatörüne güveniyor. Parker-Holder’a göre Genie ile fark, bu verilerin aracın bakış açısına göre tasarlanmış olması. Sokak Görünümü, gerçek bir yere bağlı bir dünyayı simüle etmenin yanı sıra, bakış açısını insan veya robot gibi diğer ajanslara kaydırmayı mümkün kılıyor.
Google, bugün itibarıyla Amerika’daki bazı Ultra kullanıcılara Sokak Görünümü’nü tanıtmaya başlıyor ve zamanla geniş çapta erişim sağlanacak. Araştırmacıların amacı, bu yeni beceriyi olabildiğince çok kişiye ulaştırmak. Ancak Diego Rivas, DeepMind’dan bir ürün yöneticisi, Sokak Görünümü’nün özel bir deneme olduğunu ve doğruluk açısından geliştirilecek çok şey olduğunu belirtti.
Google ekibinin bana gösterdiği örneklerde — daha önce yaşadığım bir mahallenin su altı simülasyonu dahil — sonuçlar etkileyici ve tanıdık, ancak hala video oyunu kalitesinde ve fotogerçekçi değil. Modeller, henüz fizik bilgisine sahip değil, yani neden-sonuç ilişkisini anlayamıyorlar. Örneğin, karla kaplı bir Joshua Tree simülasyonunda, bir kadın kaktüslerin ve çalıların arasından koştu.
Bunu, Google’ın görüntü üreteci Nano Banana’sı ile karşılaştırın — artık infografikleri mükemmel metinle oluşturabiliyor — ya da videoları anlayan video üreteci Veo ile; kağıt teknelerin su akıntılarında sürüklendiğini, dumana yayıldığını ve kumaşların formlar üzerinde nasıl düşeceğini anlıyor.
Fizik bu modellere sert kodlanmamış; zamanla, pasif gözlem yoluyla, bir canlı varlık gibi sezgisel bir şekilde öğreniyorlar.
Parker-Holder, “Bu tür bir modelin, video ile karşılaştırıldığında doğruluk ve kalite açısından altı ila on iki ay geride olduğunu düşünüyorum. Bu sorunun çözüleceğini düşünüyorum,” dedi.
Google Haritalar’ın direktörü Jonathan Herbert, 12 yıl önce intern olarak başladığı Sokak Görünümü ekibinin başında olduğunu belirtti ve Genie’nin henüz bir sokağın sadık bir yeniden yapımını oluşturamadığını ifade etti. Gerçek yenilik, AI’nın mekansal sürekliliği ile ilgili. 360 derece döndüğünüzde, AI arkanızdaki ortamı hatırlayıp simüle ediyor. O noktadan itibaren model, o ortamın üzerine yeni bir dünya inşa edebiliyor.
Herbert, “Sokak Görünümü verileri üzerine dünyanın en iyi ve en zengin modelini nasıl oluşturabileceğimizi uzun zamandır düşündük” dedi. “Harita Verilerini yeni yollar ve yeni tür AI araştırmaları için kullanmanın bizim için kesinlikle bir fikir olduğunu biliyorduk.”
Makalelerimizdeki bağlantılar üzerinden alışveriş yaptığınızda, küçük bir komisyon kazanabiliriz. Bu durum, editoryal bağımsızlığımızı etkilemez.

