[A version of this piece first appeared in TechCrunch’s robotics newsletter, Actuator. Subscribe here.]
Üretken yapay zeka konusu, haber bültenim Actuator’da sık sık gündeme geliyor. Birkaç ay önce bu konuya daha fazla zaman ayırma konusunda biraz tereddütlü olduğumu itiraf etmeliyim. Benim kadar uzun süredir teknoloji hakkında haber yapan herkes, sayısız yutturmaca döngüsünden geçmiş ve daha önce yanmıştı. Teknolojiyle ilgili haber yapmak, sağlıklı bir dozda şüphecilik gerektirir ve bunun, neler yapılabileceğine dair bir miktar heyecanla yumuşatılacağını umarız.
Bu sefer, üretken yapay zekanın kenarda beklediği, zamanını beklediği ve kriptonun kaçınılmaz kraterleşmesini beklediği görülüyordu. Bu kategorinin kanı çekilirken, ChatGPT ve DALL-E gibi projeler nefes kesen haberciliğin, umutluluğun, eleştirinin, felaketin ve teknoloji heyecan balonunun tüm farklı Kübler-Rossian aşamalarının odağı olmaya hazır bir şekilde beklemedeydi.
Yazılarımı takip edenler, hiçbir zaman kripto konusunda özellikle yükselişe geçmediğimi biliyor. Ancak üretken yapay zekada işler farklıdır. Yeni başlayanlar için, yapay zeka/makine öğreniminin ileriye dönük hayatlarımızda genel olarak daha merkezi roller oynayacağına dair neredeyse evrensel bir fikir birliği var.
Akıllı telefonlar burada harika bilgiler sunuyor. Hesaplamalı fotoğrafçılık hakkında düzenli olarak yazdığım bir konu. Son yıllarda bu alanda büyük ilerlemeler kaydedildi ve pek çok üreticinin, hem son ürünü iyileştirme hem de giriş çıtasını düşürme konusunda nihayet donanım ve yazılım arasında iyi bir denge kurduğunu düşünüyorum. Örneğin Google, Best Take ve Magic Eraser gibi düzenleme özellikleriyle gerçekten etkileyici bazı hileler başarıyor.
Elbette bunlar güzel hileler ama aynı zamanda özelliklerden ziyade kullanışlılar. Ancak ileriye dönük olarak asıl püf noktası, bunları deneyime kusursuz bir şekilde entegre etmek olacaktır. Gelecekteki ideal iş akışlarıyla, çoğu kullanıcının perde arkasında olup bitenler hakkında çok az fikri olacak veya hiç fikri olmayacak. İşe yaradığı için mutlu olacaklar. Bu klasik Apple taktik kitabıdır.
Üretken yapay zeka, başlangıçta benzer bir “vay be” etkisi sunuyor; bu da onun önceki abartılı döngüden farklı bir yönü. Teknolojiden en az haberdar olan akrabanız bilgisayarın başına oturup bir diyalog alanına birkaç kelime yazabildiğinde ve ardından kara kutunun resimler ve kısa öyküler yaymasını izleyebildiğinde, fazla kavramsallaştırmaya gerek kalmaz. Tüm bunların bu kadar çabuk benimsenmesinin nedeninin büyük bir kısmı da bu; çoğu zaman sıradan insanlar en son teknolojilerle tanıştırıldığında, bunun beş ya da 10 yıl sonra nasıl görünebileceğini hayal etmelerini gerektiriyor.
ChatGPT, DALL-E vb. ile bunu ilk elden şimdi deneyimleyebilirsiniz. Tabii bunun diğer tarafı da beklentileri karşılamanın ne kadar zor olduğu. İnsanlar, yapay zeka konusunda temel bir anlayışa sahip olmadan, robotlara insan veya hayvan zekası aşılama eğiliminde olsalar da, burada kasıtlılığı yansıtmak kolaydır. Ama artık işler böyle yürüyor. Dikkat çekici bir başlıkla yola çıkıyoruz ve insanların bu başlığın ardındaki entrikaları okuyacak kadar uzun süre ortalıkta kalmasını umuyoruz.
Spoiler uyarısı: 10 olaydan dokuzunda bunu yapmazlar ve birdenbire işleri gerçeğe döndürmek için aylarca, yıllarca harcıyoruz.
İşimin güzel yanlarından biri de bu sorunları benden çok daha akıllı insanlarla anlatabilme yeteneğidir. Bir şeyleri açıklamak için zaman ayırıyorlar ve umarım bunu okuyucular için tercüme ederken iyi bir iş çıkarırım (bazı girişimler diğerlerinden daha başarılıdır).
Üretken yapay zekanın robot teknolojisinin geleceğinde önemli bir rol oynayacağı netleştikten sonra, soruları konuşmalara dahil etmenin yollarını bulmaya başladım. Bu alandaki çoğu insanın önceki cümledeki ifadeye katıldığını görüyorum ve bunun olacağına inandıkları etkinin genişliğini görmek büyüleyici.
Örneğin, Marc Raibert ve Gill Pratt ile yakın zamanda yaptığım sohbette, ikincisi üretken yapay zekanın robot öğrenimine yaklaşımında oynadığı rolü açıkladı:
Bir şeyin nasıl yapılacağını bulduk; bu, insanın hem konumu hem de kuvveti göstermesini sağlayan modern üretken yapay zeka tekniklerini kullanarak, bir robota sadece birkaç örnekten yola çıkarak temel olarak öğretmeyi mümkün kılıyor. Kod hiçbir şekilde değiştirilmedi. Bunun dayandığı şey yayılma politikası denilen şeydir. Columbia ve MIT ile işbirliği içinde yaptığımız bir çalışma. Şu ana kadar 60 farklı beceriyi öğrettik.
Geçen hafta, Nvidia’nın Gömülü ve Uç Bilgi İşlemden Sorumlu Başkan Yardımcısı ve Genel Müdürü Deepu Talla’ya şirketin neden üretken yapay zekanın geçici bir hevesten daha fazlası olduğuna inandığını sorduğumda bana şunu söyledi:
Sanırım sonuçlarda konuşuyor. Verimlilik artışını zaten görebilirsiniz. Benim için bir e-posta oluşturabilir. Tam olarak doğru değil ama sıfırdan başlamama gerek yok. Bana %70 veriyor. Daha önce olduğundan kesinlikle daha iyi bir adım fonksiyonu olduğunu görebileceğiniz bariz şeyler var. Bir şeyi özetlemek mükemmel değil. Benim için okuyup özetlemesine izin vermeyeceğim. Dolayısıyla, üretkenliğin arttığına dair bazı işaretleri şimdiden görebilirsiniz.
Bu arada, Daniela Rus’la yaptığım son konuşmada MIT CSAIL başkanı, araştırmacıların robotları gerçekten tasarlamak için üretken yapay zekayı nasıl kullandıklarını açıkladı:
Üretken yapay zekanın hareket planlama sorunlarını bile çözmek için oldukça güçlü olabileceği ortaya çıktı. Model öngörülü çözümlere göre çok daha hızlı çözümler ve kontrol için çok daha akıcı ve insana benzer çözümler elde edebilirsiniz. Bunun çok güçlü olduğunu düşünüyorum çünkü geleceğin robotları çok daha az robotlaşacak. Hareketleri çok daha akıcı ve insana benzer olacak.
Ayrıca tasarım için üretken yapay zekayı kullandık. Bu çok güçlü. Bu aynı zamanda çok ilginç çünkü bu sadece robotlar için model oluşturmak değil. Başka bir şey yapmalısın. Sadece verilere dayalı bir model oluşturmak olamaz. Makinelerin fizik ve fiziksel dünya bağlamında anlamlı olması gerekiyor. Bu nedenle tasarımların gerekli kısıtlamaları karşıladığından emin olmak için bunları fizik tabanlı bir simülasyon motoruna bağlıyoruz.
Bu hafta Northwestern Üniversitesi’nden bir ekip kendi araştırmasını açıkladı Yapay zeka tarafından oluşturulan robot tasarımına. Araştırmacılar, “sadece saniyeler içinde başarıyla yürüyen bir robotu” nasıl tasarladıklarını sergilediler. Bakılacak pek bir şey yok, ancak ek araştırmalarla yaklaşımın daha karmaşık sistemler oluşturmak için nasıl kullanılabileceğini görmek yeterince kolay.
Araştırma lideri Sam Kriegman, “İnsan tasarımcıların önyargılarına başvurmadan, evrimin trafik sıkışıklıklarını aşan çok hızlı, yapay zeka destekli bir tasarım algoritması keşfettik” dedi. “Yapay zekaya karada yürüyebilecek bir robot istediğimizi söyledik. Sonra sadece bir düğmeye bastık ve işte! Göz açıp kapayıncaya kadar, dünya üzerinde yürüyen hiçbir hayvana hiç benzemeyen bir robotun planını üretti. Ben bu süreci ‘anlık evrim’ olarak adlandırıyorum.”
Küçük, yumuşak robotun bacaklarını takmak yapay zeka programının tercihiydi. Kriegman, “Bu ilginç çünkü yapay zekaya bir robotun bacakları olması gerektiğini söylemedik” diye ekledi. “Bacakların karada hareket etmenin iyi bir yolu olduğunu yeniden keşfetti. Ayaklı hareket aslında karasal hareketin en etkili şeklidir.”
Formant’ın kurucusu ve CEO’su Jeff Linnell bu hafta bana “Benim bakış açıma göre üretken yapay zeka ve fiziksel otomasyon/robotik, Dünya’daki yaşam hakkında bildiğimiz her şeyi değiştirecek” dedi. “Sanırım hepimiz yapay zekanın bir şey olduğu gerçeğine aşinayız ve herkesin, işinin, her şirketin ve öğrencinin etkileneceğini bekliyoruz. Bunun robotikle simbiyotik olduğunu düşünüyorum. Bir robot programlamanıza gerek kalmayacak. Robotla İngilizce konuşacaksınız, bir işlem talep edeceksiniz ve o zaman çözülecek. Bunun için bir dakika sürecek.”
Linnell, Formant’tan önce Bot & Dolly’yi kurdu ve CEO olarak görev yaptı. En çok Gravity üzerindeki çalışmalarıyla tanınan San Francisco merkezli firma, yazılım devinin gözünü sektörü hızlandırmaya (en iyi hazırlanmış planlar vb.) dikmesi nedeniyle 2013 yılında Google tarafından satın alındı. Yönetici bana, bu deneyimden çıkardığı en önemli sonucun, her şeyin yazılımla ilgili olduğu olduğunu söyledi (Intrinsic ve Everyday Robots’un DeepMind’a dahil edilmesi göz önüne alındığında, Google’ın da aynı fikirde olduğunu söyleme eğilimindeyim).