Nvidia’nın otomotiv bölümü başkanı Xinzhou Wu, altı ayda bir CEO Jensen Huang’ı, firmanın eller serbest otonom sürüş sistemi ile donatılmış bir araçta tura çıkmaya davet ediyor. Ancak bu yalnızca Wu, sistemin sürüş yetenekleri konusunda “güvenli bir şekilde” emin olduğunda oluyor.
Son olarak, ikili, Kaliforniya’nın Woodside bölgesinden San Francisco şehir merkezine, Nvidia’nın kısmen tasarladığı Tesla’nın Tam Otonom Sürüş’üne benzer bir eller serbest sürücü destek sistemi olan MB.Drive Assist Pro ile donatılmış bir Mercedes CLA sedanla gitti. Hava neşeliydi, fakat trafik oldukça yoğundu.
“Otonom moda geçtiğinde bana haber ver,” dedi Huang, yolculuk sırasında çekilen bir videoya göre “böylece güvenliğimi düşünmeden rahatlayabilirim.”
22 dakikalık video boyunca Mercedes, Huang ve Wu’yu inşaat alanları, çift park edilmiş araçlar ve turuncu konilerin sıralarından dar geçişlerle dolu yollar gibi günlük engellerin üzerinden geçiriyor. Nvidia’nın sistemi oldukça yetenekli görünüyor, fakat video düzenlenmiş ve gerçek zamanlı olarak sunulmamış. (Nvidia sözcüsü Jessica Soares daha sonra yolculuk sırasında hiçbir müdahale yaşanmadığını belirtti.)
Yine de, geçen yıl Nvidia yöneticileri ile eller serbest sürüş sistemi etkin durumda olan bir Mercedes ile yan yolculuk deneyimimden pek de farklı görünmüyordu. Sistemin trafik ışıklarını, dört yönlü durakları, çift park edilmiş araçları, korumasız sola dönüşleri ve San Francisco’nun karşısına çıkarabileceği tüm yayalar, bisikletliler ve elektrikli scooter sürücülerini yönetme yeteneğinden etkilendim. Tesla bunu biraz silikon ve birçok kamera ile yapabiliyorsa, dünyanın en değerli şirketinin de çözümü bulması doğaldır.
Fiziksel AI için ‘ChatGPT anı’
Yıllarca sahnenin arkasında faaliyet gösteren Nvidia, otonom sürüşte daha belirgin bir liderlik pozisyonu edinmeye çalışıyor. Sadece Tesla gibi şirketlere çip tedarik etmekle kalmıyor, aynı zamanda Mercedes, Jaguar Land Rover ve Lucid gibi ortaklara kendi AI destekli sürüş özelliklerini sunuyor. CES’te bu yıl, Huang, araçların belirli koşullar altında tamamen kendilerini sürebilmesine olanak tanıyan AI modelleri, simülasyon planları ve veri setlerinden oluşan Alpamayoyı tanıttı. Huang, bu duyuruyu “fiziksel AI için yeni bir dönem” olarak nitelendirdi.
Wu ile arabada Huang, daha az abartılı, daha derin düşünceli – ama teknolojinin geleceği konusunda karamsar değil. “Bence zorluk, elbette, Alpamayo, ne kadar zeki olsa da – ortam hakkında mantık yürütme yeteneğine sahip – neyi yapamayacağını bilmiyoruz,” dedi. “Ve bu zorluk ve klasik yığının bu kadar önemli olmasının nedeni.”
Yıllarca sahnenin arkasında faaliyet gösteren Nvidia, otonom sürüşte daha belirgin bir liderlik pozisyonu edinmeye çalışıyor.
Huang, Nvidia’nın otonom sürüşe yaklaşımının “benzersiz” olduğunu öne sürüyor çünkü bu, baştan sona bir AI modeli ile geleneksel, insan mühendisliğinden oluşan “klasik” bir yığını birleştiriyor. Pure baştan sona modellerin güvenliği doğrulamak için zor olduğunu düşünüyor. Aksine klasik yığın, belirli davranışların yeterince güvenli olduğunu doğrulamak için daha kolay hale getiren köklü mühendislik protokollerini ve süreçlerini takip ediyor. Her iki yaklaşımı birleştirerek, Nvidia’nın sistemi, insan benzeri bir sürüş tarzından yararlanırken aynı zamanda geleneksel yol kurallarına dayalı bir güvenlik çerçevesini koruyabiliyor.
Huang’ın sektördeki benzersiz yaklaşımı iddiası tamamen geçerli değil; diğer otonom araç operatörleri de bir aracın nasıl tepki vermesi gerektiğine dair açık güvenlik kuralları ile baştan sona sinir ağlarını bir arada kullanıyor. Ancak, daha insana benzer sürüşü ve daha az robotik olan baştan sona öğrenmenin daha popüler hale geldiği kesin. Waymo, karma bir sistem kullanıyor, Tesla ise tamamen baştan sona sinir ağlarına dayanıyor.
Bir röportajda Wu, baştan sona modellerin hız kesici gibi engelleri ya da şerit değişikliklerini mekanik ya da aşırı robotik bir his vermeden daha iyi yanıtlayabildiğini söyledi. “İşte bu yüzden bu gerçekten bir ChatGPT anı,” dedi. “Ancak arabanız gerçekten güvenle sürmeye başladığında… o zaman müşteriler kullanma konusunda daha istekli olacak.”
Tesla ve otonom sürüşün yüksek maliyeti
Wu’ya Nvidia’nın yaklaşımının Tesla’nın Tam Otonom Sürüşü ile nasıl karşılaştırıldığını sordum. Tesla’nın 8.5 milyardan fazla mil sürdüğü, ancak 23 yaralanma ve en az iki ölüm de dahil olmak üzere bazı sorunlu güvenlik olaylarında hedef olduğu belirtildi. Geçen Aralık’ta Nvidia’nın bir yöneticisi, iki sistemi birbirine karşı test ettiklerini bana söyledi. Nvidia’nın sisteminin sürücü müdahaleleri sayısının karşılaştırılabilir olduğunu, bazen bir sistemi, bazen diğerini desteklediğini dile getirdi.
Wu, Tesla’nın güvenlik kaydına doğrudan yorum yapmaktan çekindi, ancak Nvidia’nın bir dizi sensör kullandığını açıkladı. Bu sensörler arasında kameralar, radar, ultrasonik sensörler ve daha yüksek konfigürasyonlarda lidar bulunuyor. Nvidia, aşırı zor durumları yönetmek ve daha yüksek güvenlik seviyeleri elde etmek için sensör teknolojilerinde çeşitliliğin ve yedekliliğin kritik olduğunu düşünüyor.
“Ancak arabanız gerçekten güvenle sürmeye başladığında… o zaman müşteriler kullanma konusunda daha istekli olacak.”
— Xinzhou Wu
Ek sensörler ekstra maliyetler demektir. Özellikle lidarın dahil edilmesi, Nvidia’nın en güvenli sisteminin yalnızca zengin Mercedes sahiplerine ulaşabileceğini gösteriyor. Ancak Wu, Nvidia’nın dikey entegre yaklaşımının gereken güvenlik performansını en düşük maliyetle sunmalarına olanak tanıdığını düşünüyor.
Nvidia’nın DRIVE Hyperion platformu, çeşitli konfigürasyonları göz önünde bulundurarak tasarlanmıştır. Temel versiyonu, esasen kameraları ve radarı kullanarak daha basit ve maliyet etkin bir sensör kurulumunu kullanıyor. Bu sensörler, on yıl içinde kitlesel üretim sayesinde önemli ölçüde ucuzladı; ultrasonik sensörler zaten son derece uygun fiyatlı. Daha yüksek otonomi seviyeleri için platform, lidar sensörleri ekleyebilir. Lidar fiyatlarının düşmesi sayesinde, Wu, yaklaşık 40,000 ila 50,000 dolara mal olan araçların gelişmiş otonomi için gereken tam sensör yığınına sahip olabileceğini düşünüyor.
Veri avantajları ve dezavantajları
Waymo araçlarının, örneğin San Francisco’da bir siyahout sırasında kavşakları bloke etmesi gibi son zamanlardaki güvenlik olayları hakkında Wu’ya soru sordum. Wu, Nvidia’nın zaten bu tür zor durumları simülatörleriyle test ettiğini belirtti. Aslında, şirket, gerçek dünya testlerinde yaşadığı dezavantajları telafi etmek için sentetik sürüş verilerine dayanıyor. Tesla’nın geniş müşteri araç filosu sayesinde milyarlarca gerçek dünya sürüş miline sahipken, Waymo, kamu yollarında neredeyse 200 milyon tamamen otonom mil kaydetti. Nvidia’nın bu konuda nasıl ilerleyeceği için umut verici bir yolu var mı?
“Büyük altyapı oyunu gerçekten simülasyon,” dedi Wu. Nvidia, bu amaçla iki yaklaşım benimsiyor: Biri, şirket mühendislerinin, sahada araçlardan toplanan sensör verilerini kullanarak gerçek dünya sürüş senaryolarını yeniden yaratması olan sinirsel rekonstrüksiyon (NuRec). Diğeri ise, yeniden oluşturulan bir sahnedeki öğeleri değiştirerek olası sonuçları keşfetmelerini sağlıyor. Bu, mühendislerin otonom sistemin, biraz farklı koşullarda nasıl davrandığını sorgulamalarına ve orijinal veri setinde yer alan nadir uç durumları belirlemelerine olanak tanıyor.
“Bir yayayı daha hızlı, daha yavaş veya farklı bir yerde çıkartabiliriz,” dedi. “Buna veri setinin bulanıklaştırılması diyoruz.”
Nvidia, simülasyonda kullandığı verilere beslemek üzere ortaklarından dashcam görüntüleri elde etti. Ayrıca, Waymo olaylarının bu tür uç durumlarını yeniden oluşturuyor ve sistemini kesintiler olmadan yanıt vermesi için eğitiyor.
Ancak nihai hedef, bu tür uç durum tuzaklarından kaçınmak için akıl yürütmeyi kullanan bir sistem inşa etmektir – böylece ilk etapta gerçek dünya sürüş verilerine ihtiyaç kalmaz. Wu’nun ekibi, bu teoriyi pratiğe dökecek Vision Language Action modelini geliştiriyor. Bu modeller, görsel algı, dil anlama ve fiziksel eylemi birleştiren birleşik bir mimari oluşturuyor ve zaten internet ölçeğindeki veri setlerinde eğitim alan büyük temel modellere dayanıyor. Wu, bunu sürüş eğitimiyle kıyaslıyor.
“Çocuklara nasıl sürüş eğitimi verildiğinde, bir kural kitabı okurlar ve ardından 20 saat pratik yaparlar,” dedi Wu. “Genellikle, başlangıçta kötü sürücüler olamazlar – fakat tabii ki, deneyim girmekle birlikte gelişir. Nihayetinde, modelin aynı şekilde çalışmasını istiyoruz: Gelecekte, sadece bir kural kitapçığı ve 20 saatlik eğitim verisi ile sürmeyi öğrenecek.”


