[A version of this piece first appeared in TechCrunch’s robotics newsletter, Actuator. Subscribe here.]

Bu ayın başlarında Google’ın DeepMind ekibi, 33 araştırma enstitüsüyle işbirliği içinde oluşturulan robotik işlevsellik veritabanı olan Open X-Embodiment’i piyasaya sürdü. İlgili araştırmacılar, sistemi 2009 yılında kurulan ve şu anda 14 milyondan fazla görsele ev sahipliği yapan dönüm noktası niteliğindeki veritabanı ImageNet ile karşılaştırdı.

Araştırmacılar Quan Vuong ve Pannag Sanketi o dönemde şunları belirtmişti: “ImageNet’in bilgisayarlı görüntü araştırmasını ilerletmesi gibi, Open X-Embodiment’in de robot bilimini ilerletmek için aynı şeyi yapabileceğine inanıyoruz.” “Çeşitli robot gösterimlerinden oluşan bir veri seti oluşturmak, birçok farklı robot türünü kontrol edebilen, farklı talimatları takip edebilen, karmaşık görevler hakkında temel akıl yürütmeyi gerçekleştirebilen ve etkili bir şekilde genelleştirebilen genel bir model yetiştirmenin temel adımıdır.”

Duyurulduğu sırada Open X-Embodiment, 22 robot uygulamasından toplanan 500’den fazla beceri ve 150.000 görev içeriyordu. Tam olarak ImageNet rakamları değil ama iyi bir başlangıç. DeepMind daha sonra RT-1-X modelini veriler üzerinde eğitti ve bunu diğer laboratuvarlardaki robotları eğitmek için kullandı; ekiplerin şirket içi geliştirdiği yöntemlerle karşılaştırıldığında %50’lik bir başarı oranı bildirdi.

Muhtemelen bunu bu sayfalarda onlarca kez tekrarladım, ancak bu, robotik öğrenme için gerçekten heyecan verici bir dönem. Soruna farklı açılardan giderek artan bir verimlilikle yaklaşan pek çok ekiple konuştum. Ismarlama robotun saltanatı henüz sona ermedi, ancak genel amaçlı robotun belirgin bir olasılık olduğu bir dünyaya göz atıyormuşuz gibi görünüyor.

Simülasyon, yapay zekayla birlikte (üretken çeşitlilik dahil) hiç şüphesiz denklemin büyük bir parçası olacak. Konu genel görevler için donanım oluşturmaya gelince, hâlâ bazı firmalar atı arabanın önüne koymuş gibi geliyor, ama yolun birkaç yıl aşağısında, kim bilir?

Vincent Vanhoucke, bir süredir tespit etmeye çalıştığım biri. Ben müsait olsaydım o değildi. Geceleri gemiler falan. Çok şükür geçen haftanın sonuna doğru nihayet bunu başarabildik.

Vanhoucke, Mayıs ayında bu göreve adım atarak Google DeepMind’ın robot bilimi başkanı rolüne yeni katıldı. Bununla birlikte, 16 yılı aşkın bir süredir şirkette çalışıyor ve son olarak Google AI Robotics’te seçkin bir bilim insanı olarak hizmet veriyor. Sonuç olarak, Google’ın robotik hedefleri ve buraya nasıl geldiği hakkında konuşulabilecek en iyi kişi kendisi olabilir.

Resim Kredisi: Google

Robotik ekibi DeepMind tarihinin hangi noktasında gelişti?

Başlangıçta çitin DeepMind tarafında değildim. Google Araştırma’nın bir parçasıydım. Yakın zamanda DeepMind çalışmalarıyla birleştik. Yani bir bakıma DeepMind’la olan ilişkim son derece yeni. Ancak Google DeepMind’da robotik araştırmalarının daha uzun bir geçmişi var. Algı teknolojisinin gerçekten çok iyi hale geldiğine dair artan görüşle başladı.

Bilgisayarla görme, ses işleme ve tüm bu şeylerin çoğu gerçekten de köşeyi dönüyor ve neredeyse insan seviyesine ulaşıyordu. Kendimize şu soruyu sormaya başlıyoruz: “Peki, bunun önümüzdeki birkaç yılda da devam edeceğini varsayarsak, bunun sonuçları nelerdir?” Bunun açık sonuçlarından biri, birdenbire gerçek dünya ortamında robot teknolojisine sahip olmanın gerçek bir olasılık haline gelmesiydi. Gündelik bir ortamda gerçekten gelişebilmek ve görevleri yerine getirebilmek tamamen gerçekten çok güçlü bir algıya dayanıyordu. Başlangıçta genel yapay zeka ve bilgisayarlı görme üzerinde çalışıyordum. Geçmişte konuşma tanıma üzerinde de çalıştım. Duvardaki yazıyı gördüm ve araştırmamızın bir sonraki aşaması olarak robot bilimini kullanmaya karar verdim.

Anladığım kadarıyla Everyday Robots ekibinin çoğu bu takıma dahil oldu. Google’ın robot bilimi geçmişi çok daha eskilere dayanıyor. Alphabet’in tüm bu satın almaları yapmasının üzerinden 10 yıl geçti [Boston Dynamics, etc.]. Görünüşe göre bu şirketlerden pek çok kişi Google’ın mevcut robot ekibini doldurmuş durumda.

Bu satın almalardan gelen ekibin önemli bir kısmı var. Benim zamanımdan önceydi; bilgisayarla görme ve konuşma tanımayla gerçekten ilgiliydim ama hâlâ bu insanlardan çok sayıda var. Giderek daha fazla, tüm robotik probleminin genel yapay zeka probleminin kapsamına girdiği sonucuna vardık. İstihbarat kısmını gerçekten çözmek, gerçek dünyadaki robot biliminde herhangi bir anlamlı sürecin temel kolaylaştırıcısıydı. Çabalarımızın çoğunu, genel yapay zeka bağlamında algı, anlayış ve kontrolün çözülmesi gereken önemli bir sorun olacağı yönünde çözmeye kaydırdık.

Everyday Robots’un yaptığı işlerin çoğu genel yapay zekaya veya üretken yapay zekaya değiniyormuş gibi görünüyordu. Ekibin yaptığı iş DeepMind robot ekibine mi aktarılıyor?

Söylemek isterim ki Everyday Robots ile yedi yıldır işbirliği yapıyorduk. İki ayrı ekip olmamıza rağmen çok derin bağlantılarımız var. Aslına bakılırsa, o zamanlar bizi gerçekten robot teknolojisine bakmaya teşvik eden şeylerden biri, Everyday Robots ekibiyle bir nevi skunkworks projesi olan bir işbirliğiydi; orada, etrafta çok sayıda robot kolu vardı. durduruldu. Onlar yeni bir nesle yol açan bir nesil silahtı ve hiçbir şey yapmadan öylece yatıyorlardı.

Bu kolları alıp hepsini bir odaya koymanın, pratik yapmalarını ve nesneleri kavramayı öğrenmelerini sağlamanın eğlenceli olacağına karar verdik. Kavrama problemini öğrenme fikri o zamanlar zamanın ruhunda değildi. Robotik kavramayı kontrol etmenin yolu olarak makine öğrenimini ve algıyı kullanma fikri keşfedilen bir şey değildi. Silahlar başarılı olduğunda onlara bir ödül verdik, başarısız olduklarında ise onları beğenmedik.

İlk kez makine öğrenimini kullandık ve makine öğrenimini ve yapay zekayı kullanarak bu genelleştirilmiş kavrama sorununu esasen çözdük. O zamanlar bu bir ampul anıydı. Orada gerçekten yeni bir şey vardı. Bu, Everyday Robots ile bu robotları kontrol etmenin bir yolu olarak makine öğrenimine odaklanma konusundaki araştırmaları tetikledi. Ve ayrıca araştırma tarafında, çok daha fazla robot bilimini ilginç bir problem olarak iterek, diğer alanlarda çok iyi çalışabildiğimiz tüm derin öğrenme yapay zeka tekniklerini uygulayabiliyoruz.

DeepMind yapay zekayı somutlaştırdı

Resim Kredisi: Derin Düşünce

Everyday Robots ekibiniz tarafından benimsendi mi?

Takımın bir kısmı benim takımım tarafından emildi. Robotları bize miras kaldı ve hala kullanıyoruz. Bugüne kadar onların gerçekten öncülük ettiği ve üzerinde çalıştığı teknolojiyi geliştirmeye devam ediyoruz. Tüm ivme, ekibin başlangıçta öngördüğünden biraz farklı bir odaklanmayla devam ediyor. Gerçekten robot binasından çok istihbarat parçasına odaklanıyoruz.

Ekibin Alphabet X ofislerine taşındığını söylemiştiniz. Ekipler arası işbirliği ve kaynak paylaşımı konusunda daha derin bir şeyler var mı?

Bu çok pragmatik bir karar. İyi bir Wi-Fi’ye, iyi bir güce ve çok fazla alana sahipler.

Umarım tüm Google binalarında iyi bir Wi-Fi bulunur.

Öyle umuyorsun, değil mi? Ama buraya taşınmamız oldukça sıradan bir karardı. Söylemeliyim ki, kararların çoğu burada iyi bir kafenin olmasıydı. Önceki ofisimizin yemekleri pek iyi değildi ve insanlar şikayet etmeye başlıyordu. Orada gizli bir gündem yok. X’in geri kalanıyla yakın çalışmayı seviyoruz. Orada çok fazla sinerji olduğunu düşünüyorum. Bir dizi proje üzerinde çalışan gerçekten yetenekli robot uzmanları var. Intrinsic ile geliştirmeyi sevdiğimiz işbirliklerimiz var. Burada olmamız bizim için çok anlamlı ve çok güzel bir bina.

Intrinsic ile platformlarıyla yaptıkları şeyler açısından bir miktar örtüşme var – kodsuz robotik ve robotik öğrenimi gibi şeyler. Genel ve üretken yapay zeka ile örtüşüyorlar.

Robot teknolojisinin her köşeden başlayarak nasıl özel olarak tasarlanıp çok farklı uzmanlık ve becerilere sahip olarak evrimleştiği ilginçtir. İçinde bulunduğumuz yolculuk, büyük ölçüde, ister endüstriyel bir ortama, ister daha çok ev ortamına uygulansın, genel amaçlı robot bilimini gerçekleştirmeye çalışmaktır. Çok güçlü bir yapay zeka çekirdeğinin yönlendirdiği bunun arkasındaki prensipler çok benzer. Mümkün olduğu kadar geniş bir uygulama alanını nasıl destekleyebileceğimizi keşfetmeye çalışırken sınırları gerçekten zorluyoruz. Bu yeni ve heyecan verici. Oldukça yeşil bir alan. Uzayda keşfedilecek çok şey var.

İnsanlara makul bir şekilde genel amaçlı robot teknolojisi diyebileceğimiz bir şeyden ne kadar uzakta olduğumuzu düşündüklerini sormayı seviyorum.

Genel amaçlı robot teknolojisinin tanımında ufak bir nüans vardır. Gerçekten genel amaçlı yöntemlere odaklandık. Bazı yöntemler, hem endüstriyel hem de ev robotlarına veya kaldırım robotlarına, tüm bu farklı düzenlemeler ve form faktörleriyle uygulanabilir. Sorununuz için özel olarak tasarlanmış bir bedene sahip olmanızdan daha çok, sizin için her şeyi yapan genel amaçlı bir bedenlenmenin var olmasını temel almıyoruz. Bu iyi. Özellikle yaşadığınız sorunu çözecek şekilde hızlı bir şekilde ince ayar yapabiliriz. Bu büyük bir soru: Genel amaçlı robotlar olacak mı? Bu, pek çok insanın gerçekleşip gerçekleşmeyeceği ve ne zaman gerçekleşeceği konusunda hipotezler ortaya attığı bir şey.

Şu ana kadar ısmarlama robotlarla daha fazla başarı elde edildi. Bir dereceye kadar teknolojinin daha genel amaçlı robotların üretilmesini sağlayacak düzeyde olmadığını düşünüyorum. İş modelinin bizi nereye götüreceği çok iyi bir soru. Arkasındaki teknolojiye daha fazla güven duymadıkça bu sorunun yanıtlanabileceğini düşünmüyorum. Şu anda kullandığımız şey bu. Belirli bir düzenlemeye bağlı olmayan çok genel yaklaşımların makul olduğuna dair daha fazla yaşam belirtisi görüyoruz. En son yaptığımız şey bu RTX projesi. Birkaç akademik laboratuvara gittik – sanırım şu anda 30 farklı ortağımız var – ve görevlerine ve topladıkları verilere bakmamızı istedik. Bunu ortak bir veri havuzuna çekelim ve bunun üzerine büyük bir model eğitelim ve ne olacağını görelim.

DeepMind RoboCat

Resim Kredisi: Derin Düşünce

Üretken yapay zeka robot biliminde nasıl bir rol oynayacak?

Çok merkezi olacağını düşünüyorum. Büyük bir dil modeli devrimi yaşandı. Herkes robotlar için çok sayıda dil modeli kullanıp kullanamayacağımızı sormaya başladı ve bence bu çok yüzeysel olabilirdi. Bilirsiniz, “Günün modasını alıp onunla ne yapabileceğimize bakalım” ama bunun son derece derin olduğu ortaya çıktı. Bunun nedeni, eğer düşünürseniz, dil modellerinin aslında dille ilgili olmamasıdır. Bunlar sağduyulu akıl yürütme ve gündelik dünyayı anlamayla ilgilidir. Yani, büyük dil modeli bir fincan kahve aradığınızı biliyorsa, muhtemelen onu mutfaktaki bir dolapta veya masanın üzerinde bulabilirsiniz.

Masaya bir kahve fincanı koymak mantıklıdır. Kahve fincanının üzerine masa koymak saçmalıktır. Bunlar gerçekten düşünmediğiniz basit gerçeklerdir çünkü bunlar sizin için tamamen açıktır. Bunu somutlaşmış bir sisteme iletmek her zaman gerçekten zor olmuştur. Bilgiyi kodlamak gerçekten çok zordur, oysa bu büyük dil modelleri bu bilgiye sahiptir ve onu çok erişilebilir ve bizim kullanabileceğimiz bir şekilde kodlar. Böylece bu sağduyulu muhakemeyi alıp robot planlamasına uygulayabildik. Bunu robot etkileşimlerine, manipülasyonlara, insan-robot etkileşimlerine uygulayabildik ve bu sağduyuya sahip olan ve simüle edilmiş bir ortamdaki şeyler hakkında mantık yürütebilen bir aracıya sahip olmanın yanı sıra algı, robotik probleminin gerçekten merkezinde yer alıyor.

Derin Zihin Gato

Gato’nun tamamlamayı öğrendiği çeşitli görevler.

Simülasyon muhtemelen analiz için veri toplamanın büyük bir parçasıdır.

Evet. Bu, bunun bir bileşenidir. Simülasyonun zorluğu, simülasyon ile gerçeklik arasındaki boşluğu kapatmanız gerektiğidir. Simülasyonlar gerçekliğin bir tahminidir. Gerçeği çok kesin ve çok yansıtıcı hale getirmek çok zor olabilir. Bir simülatörün fiziğinin iyi olması gerekir. Bu simülasyondaki gerçekliğin görsel sunumunun çok iyi olması gerekiyor. Bu aslında üretken yapay zekanın damgasını vurmaya başladığı başka bir alandır. Gerçekte bir fizik simülatörü çalıştırmak yerine, sadece görüntü oluşturma veya bir tür üretken model kullanarak üretim yaptığınızı hayal edebilirsiniz.

Tye Brady yakın zamanda bana Amazon’un paket oluşturmak için simülasyon kullandığını söyledi.

Bu çok mantıklı. Ve ileriye dönük olarak, sadece varlık üretmenin ötesinde, gelecek yaratmayı da hayal edebileceğinizi düşünüyorum. Robot bir eylem yapsaydı ne olacağını hayal edin? Ve gerçekten istediğiniz şeyi yaptığını doğrulamak ve bunu gelecek için planlamanın bir yolu olarak kullanmak. Bu, gerçek dünyada bunu yapmak zorunda olmak yerine üretken modeller kullanan robotun rüya görmesi gibi bir şey.



genel-24