Temel modellerin dijital dünyada yapay zekayı dönüştürdüğü bir sır değil. ChatGPT, LLaMA ve Bard gibi büyük dil modelleri (LLM’ler), dil için yapay zekada devrim yarattı. OpenAI’nin GPT modelleri mevcut tek büyük dil modeli olmasa da, karmaşık problem çözme ve gelişmiş akıl yürütme gerektiren bazı görevlerde bile metin ve görüntü girdilerini alma ve insan benzeri yanıtlar verme konusunda en genel kabulü elde etti.

ChatGPT’nin viral ve yaygın şekilde benimsenmesi, toplumun yapay zeka için bu yeni anı nasıl anladığını büyük ölçüde şekillendirdi.

Nesiller boyunca yapay zekayı tanımlayacak bir sonraki gelişme robotiktir. Fiziksel dünyayla nasıl etkileşime gireceğini öğrenebilen yapay zeka destekli robotlar oluşturmak, lojistik, ulaşım ve üretimden perakende, tarım ve hatta sağlık hizmetlerine kadar çeşitli sektörlerde tekrarlanan her türlü işi geliştirecek. Aynı zamanda, son birkaç on yılda dijital dünyada gördüğümüz kadar çok verimliliğin kilidini fiziksel dünyada da açacak.

Dile kıyasla robotikte çözülmesi gereken benzersiz bir dizi sorun olsa da temel temel kavramlar arasında benzerlikler var. Yapay zeka alanındaki en parlak beyinlerden bazıları, “robot bilimi için GPT”yi oluşturma konusunda önemli ilerlemeler kaydetti.

GPT’nin başarısını sağlayan nedir?

“Robot bilimi için GPT”nin nasıl oluşturulacağını anlamak için öncelikle GPT gibi Yüksek Lisans’ların başarısını mümkün kılan temel unsurlara bakın.

Temel modeli yaklaşımı

GPT, geniş ve çeşitli bir veri kümesi üzerinde eğitilmiş bir yapay zeka modelidir. Mühendisler daha önce veri topladı ve belirli bir sorun için özel yapay zekayı eğitti. Daha sonra bir başkasını çözmek için yeni veriler toplamaları gerekecekti. Başka bir problem? Yine yeni veriler. Şimdi vakıf modeli yaklaşımında ise tam tersi yaşanıyor.

Her kullanım durumu için niş yapay zekalar oluşturmak yerine evrensel olarak kullanılabilir. Ve bu çok genel model, her özel modelden daha başarılıdır. Temel modeldeki yapay zeka belirli bir görevde daha iyi performans gösterir. Diğer görevlerden öğrendiklerini kullanabilir ve yeni görevlere daha iyi genelleyebilir çünkü çeşitli görevlerde iyi performans gösterme zorunluluğundan dolayı ek beceriler öğrenmiştir.

Büyük, özel ve yüksek kaliteli bir veri kümesi üzerinde eğitim

Genelleştirilmiş bir yapay zekaya sahip olmak için öncelikle çok sayıda farklı veriye erişmeniz gerekir. OpenAI, GPT modellerini makul derecede verimli bir şekilde eğitmek için gereken gerçek dünya verilerini elde etti. GPT, kitaplar, haber makaleleri, sosyal medya gönderileri, kodlar ve daha fazlasını içeren geniş ve çeşitli bir veri kümesiyle internetin tamamından toplanan veriler üzerine eğitim vermiştir.

Fiziksel dünyayla nasıl etkileşime gireceğini öğrenebilen yapay zeka destekli robotlar oluşturmak, her türlü tekrarlayan çalışmayı geliştirecektir.

Önemli olan yalnızca veri kümesinin boyutu değildir; Yüksek kaliteli, yüksek değerli verilerin seçilmesi de büyük bir rol oynar. GPT modelleri, yüksek kaliteli veri kümelerinin ağırlıklı olarak kullanıcıların önemsediği görevler ve en yararlı yanıtlar tarafından bilgilendirildiği için benzeri görülmemiş bir performans elde etti.

Takviyeli öğrenmenin rolü (RL)

OpenAI, modelin yanıtını insan tercihiyle (örneğin, kullanıcı için neyin faydalı olduğu düşünülüyor) uyumlu hale getirmek için insan geri bildiriminden (RLHF) takviyeli öğrenmeyi kullanır. Saf denetimli öğrenmeden (SL) daha fazlasına ihtiyaç vardır çünkü SL bir soruna yalnızca net bir model veya örnekler dizisiyle yaklaşabilir. Yüksek Lisans, yapay zekanın benzersiz, doğru bir cevap olmadan bir hedefe ulaşmasını gerektirir. RLHF’ye girin.

RLHF, insan doğru yanıtları kabul ederken (yüksek ödül) veya yanlış yanıtları reddederken (düşük ödül) algoritmanın deneme yanılma yoluyla bir hedefe doğru ilerlemesine olanak tanır. Yapay zeka, insanın tercihini en iyi açıklayan ödül fonksiyonunu buluyor ve ardından oraya nasıl ulaşılacağını öğrenmek için RL’yi kullanıyor. ChatGPT, insan geri bildirimlerinden öğrenerek insan düzeyindeki yetenekleri yansıtan veya aşan yanıtlar sunabilir.

Temel modellerinin bir sonraki sınırı robotikte

GPT’nin görmesine, düşünmesine ve hatta konuşmasına olanak tanıyan aynı temel teknoloji, makinelerin de görmesine, düşünmesine ve hareket etmesine olanak tanır. Temel modelle desteklenen robotlar, fiziksel çevrelerini anlayabilir, bilinçli kararlar verebilir ve eylemlerini değişen koşullara uyarlayabilir.

“Robot bilimi için GPT”, GPT ile aynı şekilde inşa ediliyor; bildiğimiz yapay zekayı bir kez daha yeniden tanımlayacak bir devrimin temellerini atıyor.

Temel modeli yaklaşımı

Temel model yaklaşımını benimseyerek fiziksel dünyadaki birden fazla görevde çalışan tek bir yapay zeka da oluşturabilirsiniz. Birkaç yıl önce uzmanlar, market ürünlerini toplayan ve paketleyen robotlar için özel bir yapay zeka yapılmasını önerdi. Ve bu, çeşitli elektrikli parçaları sıralayabilen bir modelden farklıdır ve bu, paletleri bir kamyondan boşaltan modelden farklıdır.

Temel modele yönelik bu paradigma değişimi, yapay zekanın, yapılandırılmamış gerçek dünya ortamlarında sıklıkla var olan uç durum senaryolarına daha iyi yanıt vermesini sağlar ve aksi takdirde, daha dar eğitimle modelleri sekteye uğratabilir. Tüm bu senaryolar için genelleştirilmiş tek bir yapay zeka oluşturmak daha başarılıdır. Önceki nesil robotlarda kaçırdığımız insan düzeyindeki özerkliğe, her şey üzerinde eğitim vererek sahip olabilirsiniz.

Büyük, özel ve yüksek kaliteli bir veri kümesi üzerinde eğitim

Bir robota hangi eylemlerin başarıya, neyin başarısızlığa yol açtığını öğrenmeyi öğretmek son derece zordur. Gerçek dünyadaki fiziksel etkileşimlere dayanan kapsamlı, yüksek kaliteli veriler gerektirir. Tek laboratuvar ayarları veya video örnekleri güvenilir değildir veya yeterince sağlam kaynaklardır (örneğin, YouTube videoları fiziksel etkileşimin ayrıntılarını tercüme etmekte başarısızdır ve akademik veri kümeleri kapsam olarak sınırlı olma eğilimindedir).

Dil veya görüntü işlemeye yönelik yapay zekadan farklı olarak, önceden var olan hiçbir veri kümesi, robotların fiziksel dünyayla nasıl etkileşime girmesi gerektiğini temsil etmez. Böylece, büyük, yüksek kaliteli veri kümesi robot biliminde çözülmesi daha karmaşık bir sorun haline gelir ve üretimde bir robot filosunun konuşlandırılması, çeşitliliğe sahip bir veri kümesi oluşturmanın tek yoludur.

Takviyeli öğrenmenin rolü

Metin sorularını insan düzeyindeki yetenekle yanıtlamaya benzer şekilde, robotik kontrol ve manipülasyon, bir aracının tek, benzersiz ve doğru yanıtı olmayan bir hedefe doğru ilerleme aramasını gerektirir (örneğin, “Bu kırmızı soğanı almanın başarılı yolu nedir?”) . Bir kez daha, denetimli öğrenmeden daha fazlasına ihtiyaç duyulmaktadır.

Robotikte başarılı olmak için derin takviyeli öğrenmeyi (derin RL) çalıştıran bir robota ihtiyacınız var. Bu özerk, kendi kendine öğrenen yaklaşım, daha yüksek performans seviyelerinin kilidini açmak için RL’yi derin sinir ağlarıyla birleştirir; yapay zeka, öğrenme stratejilerini otomatik olarak uyarlayacak ve yeni senaryoları deneyimledikçe becerilerinde ince ayar yapmaya devam edecektir.

Zorlu, patlayıcı büyüme geliyor

Geçtiğimiz birkaç yılda dünyanın en parlak yapay zeka ve robot bilimi uzmanlarından bazıları, yapay zekanın geleceğini yeniden tanımlayacak bir robotik temel modeli devriminin teknik ve ticari temelini attı.

Bu yapay zeka modelleri GPT’ye benzer şekilde oluşturulmuş olsa da, fiziksel dünyada insan düzeyinde özerkliğe ulaşmak iki nedenden dolayı farklı bir bilimsel zorluktur:

  1. Çeşitli gerçek dünya ortamlarına hizmet edebilecek yapay zeka tabanlı bir ürün oluşturmak, dikkate değer bir dizi karmaşık fiziksel gereksinime sahiptir. Bir donanımın çeşitli endüstrilerde (lojistik, taşımacılık, üretim, perakende, tarım, sağlık vb.) ve her sektördeki faaliyetlerde çalışacağı şüpheli olduğundan yapay zekanın farklı donanım uygulamalarına uyum sağlaması gerekir.
  2. Depolar ve dağıtım merkezleri, fiziksel dünyadaki yapay zeka modelleri için ideal bir öğrenme ortamıdır. Herhangi bir anda herhangi bir tesisten yüzbinlerce, hatta milyonlarca farklı stok tutma biriminin (SKU) akması yaygındır; bu da “robot bilimi için GPT”yi eğitmek için gereken büyük, özel ve yüksek kaliteli veri kümesini sağlar.

Yapay zeka robotiğinin “GPT anı” yaklaşıyor

Robotik temel modellerinin büyüme yörüngesi çok hızlı bir şekilde hızlanıyor. Robotik uygulamalar, özellikle de hassas nesne manipülasyonu gerektiren görevler kapsamında, gerçek dünyadaki üretim ortamlarında zaten uygulanıyor ve 2024’te katlanarak artan sayıda ticari açıdan uygun robotik uygulamanın geniş ölçekte konuşlandırıldığını göreceğiz.

Chen, önde gelen küresel yapay zeka ve makine öğrenimi dergilerinde yer alan 30’dan fazla akademik makale yayınladı.



genel-24