Waymo, uzun süredir Google’ın DeepMind’ıyla olan bağlarını ve on yıllardır süren yapay zeka araştırmalarını, otonom sürüş alanındaki rakiplerine göre stratejik bir avantaj olarak öne sürüyor. Şimdi Alphabet’in sahibi olduğu şirket, robotaksileri için Google’ın çok modlu büyük dil modeli (MLLM) Gemini’yi temel alan yeni bir eğitim modeli geliştirerek bunu bir adım daha ileri taşıyor.

Waymo bugün, EMMA olarak da bilinen “Otonom Sürüş için Uçtan Uca Multimodal Model”i tanıtan yeni bir araştırma makalesi yayınladı. Bu yeni uçtan uca eğitim modeli, “otonom araçlar için gelecekteki yörüngeler” oluşturmak üzere sensör verilerini işleyerek Waymo’nun sürücüsüz araçlarının nereye gidecekleri ve engellerden nasıl kaçınacakları konusunda kararlar almasına yardımcı oluyor.

Ancak daha da önemlisi bu, otonom sürüş liderinin operasyonlarında MLLM’leri kullanmaya yönelik tasarımlara sahip olduğunun ilk göstergelerinden biri. Ve bu, bu Yüksek Lisans’ların sohbet robotları, e-posta düzenleyicileri ve görüntü oluşturucular olarak mevcut kullanımlarından kurtulabileceklerinin ve yolda tamamen yeni bir ortamda uygulama bulabileceklerinin bir işareti. Waymo, araştırma makalesinde “MLLM’nin birinci sınıf vatandaş olduğu otonom bir sürüş sistemi geliştirmeyi” öneriyor.

EMMA olarak da bilinen Otonom Sürüş için Uçtan Uca Multimodal Model

Makale, tarihsel olarak otonom sürüş sistemlerinin algılama, haritalama, tahmin ve planlama dahil olmak üzere çeşitli işlevler için nasıl özel “modüller” geliştirdiğini özetlemektedir. Bu yaklaşımın uzun yıllardır faydalı olduğu kanıtlanmıştır ancak “modüller arasında biriken hatalar ve modüller arası sınırlı iletişim nedeniyle” ölçeklendirme sorunları vardır. Üstelik bu modüller “yeni ortamlara” yanıt vermekte zorlanabilir çünkü doğaları gereği “önceden tanımlanmışlardır” ve bu da uyum sağlamayı zorlaştırabilir.

Waymo, Gemini gibi MLLM’lerin bu zorlukların bazılarına iki nedenden dolayı ilginç bir çözüm sunduğunu söylüyor: sohbet, internetten alınan geniş veri kümeleri üzerinde eğitilmiş bir “genel” bilgidir ve “ortak olarak içerilenlerin ötesinde zengin ‘dünya bilgisi’ sağlar” sürüş günlükleri”; ve karmaşık görevleri bir dizi mantıksal adıma bölerek insan akıl yürütmesini taklit eden “düşünce zinciri akıl yürütme” gibi teknikler aracılığıyla “üstün” akıl yürütme yetenekleri gösterirler.

Waymo’nun EMMA modeli.
Ekran görüntüsü: Waymo

Waymo, EMMA’yı robot eksenlerinin karmaşık ortamlarda gezinmesine yardımcı olacak bir araç olarak geliştirdi. Şirket, çeşitli hayvanlarla karşılaşmak veya yoldaki inşaatlar da dahil olmak üzere, modelin sürücüsüz araçlarının doğru rotayı bulmasına yardımcı olduğu çeşitli durumları tespit etti.

Tesla gibi diğer şirketler de otonom arabaları için uçtan uca modeller geliştirme konusunda yoğun bir şekilde konuştu. Elon Musk’un iddiaları Tam Otomatik Sürüş sisteminin (12.5.5) en son sürümünün, kamera görüntülerini sürüş kararlarına dönüştüren bir “uçtan uca sinir ağları” yapay zeka sistemi kullandığını söyledi.

Bu, gerçek sürücüsüz araçların yollarda kullanılması konusunda Tesla’ya liderlik eden Waymo’nun aynı zamanda uçtan uca bir sistem peşinde koşmakla ilgilendiğinin açık bir göstergesi. Şirket, EMMA modelinin yörünge tahmini, nesne tespiti ve yol grafiğini anlama konusunda mükemmel olduğunu söyledi.

Şirket bugün bir blog yazısında şunları söyledi: “Bu, daha da temel otonom sürüş görevlerinin benzer, ölçeklendirilmiş bir kurulumda birleştirilebileceği, gelecekteki araştırmalar için umut verici bir yol öneriyor.”

Ancak EMMA’nın da sınırlamaları var ve Waymo, modelin uygulamaya konulmasından önce gelecekte araştırma yapılması gerektiğini kabul ediyor. Örneğin EMMA, Lidar veya radardan gelen 3 boyutlu sensör girişlerini birleştiremedi; Waymo bunun “hesaplama açısından pahalı” olduğunu söyledi. Ve aynı anda yalnızca az miktarda görüntü karesini işleyebiliyordu.

Araştırma makalesinde bahsedilmeyen robotaksileri eğitmek için MLLM’leri kullanmanın riskleri de vardır. Gemini gibi sohbet robotları genellikle halüsinasyon görüyor veya saatleri okumak veya nesneleri saymak gibi basit görevlerde başarısız oluyor. Waymo’nun otonom araçları yoğun bir yolda 60 km/saat hızla giderken hata payı çok azdır. Bu modellerin geniş ölçekte devreye alınabilmesi için daha fazla araştırmaya ihtiyaç duyulacak ve Waymo bu konuda net.

Şirketin araştırma ekibi şöyle yazıyor: “Sonuçlarımızın bu sorunları hafifletmek ve otonom sürüş modeli mimarilerindeki en son teknolojiyi daha da geliştirmek için daha fazla araştırmaya ilham vereceğini umuyoruz.”



genel-2