OpenAI, Yeni Modelinin 'Genel Zeka' Testinde İnsan Seviyesine Ulaştığını İddia Ediyor. Bu ne anlama gelir? - Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film

Contents

Genelleme ve zeka
Izgaralar ve desenler
Zayıf kurallar ve adaptasyon
Düşünce zincirlerini mi arıyorsunuz?
Hala bilmediğimiz şey

Yeni bir yapay zeka (AI) modeli yakın zamanda ortaya çıktı insan düzeyinde sonuçlar elde edildi “Genel zekayı” ölçmek için tasarlanmış bir testte.

20 Aralık’ta OpenAI’nin o3 sistemi %85 puan aldı. ARC-AGI karşılaştırmasıBu, önceki AI en iyi puanı olan %55’in çok üzerinde ve ortalama insan puanıyla aynı seviyede. Ayrıca çok zor bir matematik testinde de iyi puan aldı.

Yapay genel zeka veya AGI yaratmak, tüm büyük yapay zeka araştırma laboratuvarlarının belirtilen hedefidir. İlk bakışta OpenAI en azından bu hedefe yönelik önemli bir adım atmış gibi görünüyor.

Şüphecilik devam etse de birçok yapay zeka araştırmacısı ve geliştiricisi bir şeylerin değiştiğini düşünüyor. Çoğu kişi için YGZ’nin geleceği artık beklenenden daha gerçek, acil ve daha yakın görünüyor. Haklılar mı?

Genelleme ve zeka

o3 sonucunun ne anlama geldiğini anlamak için ARC-AGI testinin neyle ilgili olduğunu anlamanız gerekir. Teknik açıdan bu, bir yapay zeka sisteminin yeni bir şeye uyum sağlamadaki “örnek verimliliği”nin (sistemin nasıl çalıştığını anlamak için yeni bir durumun kaç örneğini görmesi gerektiğinin) testidir.

ChatGPT (GPT-4) gibi bir yapay zeka sistemi örnek açısından pek verimli değildir. Milyonlarca insan metni örneği üzerinde “eğitildi” ve hangi kelime kombinasyonlarının en muhtemel olduğuna ilişkin olasılıksal “kurallar” oluşturuldu.

Sonuç ortak görevlerde oldukça iyidir. Sıra dışı görevlerde kötüdür çünkü bu görevlerle ilgili daha az veriye (daha az örnek) sahiptir.

Yapay zeka sistemleri az sayıdaki örneklerden öğrenip daha fazla örnek verimliliğiyle uyum sağlayana kadar, yalnızca çok tekrarlanan ve ara sıra yaşanan hataların tolere edilebildiği işler için kullanılacaktır.

Sınırlı veri örneklerinden daha önce bilinmeyen veya yeni problemleri doğru bir şekilde çözme yeteneği, genelleme kapasitesi olarak bilinir. Yaygın olarak zekanın gerekli, hatta temel bir unsuru olarak kabul edilir.

Izgaralar ve desenler

ARC-AGI kıyaslama testi, aşağıdaki gibi küçük ızgara karesi problemlerini kullanarak örnek verimli uyarlamayı test eder. Yapay zekanın soldaki ızgarayı sağdaki ızgaraya dönüştüren modeli bulması gerekiyor.

Siyah ızgara arka planında renkli karelerden oluşan çeşitli desenler. — ARC-AGI kıyaslama testinden örnek bir görev.
ARC Ödülü

Her soruda öğrenilecek üç örnek verilmektedir. Yapay zeka sisteminin daha sonra üç örnekten dördüncüye kadar “genelleyen” kuralları bulması gerekiyor.

Bunlar bazen okuldan hatırlayabileceğiniz IQ testlerine çok benzer.

Zayıf kurallar ve adaptasyon

OpenAI’nin bunu nasıl yaptığını tam olarak bilmiyoruz, ancak sonuçlar o3 modelinin son derece uyarlanabilir olduğunu gösteriyor. Sadece birkaç örnekten genelleştirilebilecek kurallar buluyor.

Bir model ortaya çıkarmak için gereksiz varsayımlarda bulunmamalı veya gerçekte olmamız gerekenden daha spesifik olmamalıyız. İçinde teoriİstediğinizi yapan “en zayıf” kuralları belirleyebilirseniz, yeni durumlara uyum sağlama yeteneğinizi en üst düzeye çıkarmışsınız demektir.

En zayıf kurallardan neyi kastediyoruz? Teknik tanım karmaşıktır ancak daha zayıf kurallar genellikle uygulanabilen kurallardır. daha basit ifadelerle açıklanmıştır.

Yukarıdaki örnekte, kuralın sade İngilizce ifadesi şöyle olabilir: “Çıkıntılı bir çizgiye sahip herhangi bir şekil, bu çizginin sonuna doğru hareket edecek ve örtüştüğü diğer şekilleri ‘örtecektir’.”

Düşünce zincirlerini mi arıyorsunuz?

OpenAI’nin bu sonuca nasıl ulaştığını henüz bilmiyor olsak da, zayıf kuralları bulmak için o3 sistemini kasıtlı olarak optimize etmeleri pek mümkün görünmüyor. Ancak ARC-AGI görevlerinde başarılı olmak için onları bulmak gerekir.

OpenAI’nin o3 modelinin genel amaçlı bir versiyonuyla başladığını (bu, diğer modellerin çoğundan farklıdır, çünkü zor sorular hakkında “düşünmeye” daha fazla zaman ayırabilir) ve ardından onu özel olarak ARC-AGI testi için eğittiğini biliyoruz.

Karşılaştırmayı tasarlayan Fransız yapay zeka araştırmacısı Francois Chollet, inanıyor o3, görevi çözmek için gereken adımları açıklayan farklı “düşünce zincirlerini” araştırır. Daha sonra gevşek bir şekilde tanımlanmış bir kurala veya “sezgisel yönteme” göre “en iyiyi” seçecektir.

Bu, Google’ın AlphaGo sisteminin dünya Go şampiyonunu yenmek için farklı olası hamle dizilerini aramasından “farklı değil”.

Bu düşünce zincirlerini örneklere uyan programlar gibi düşünebilirsiniz. Elbette, eğer Go oynayan yapay zeka gibiyse, hangi programın en iyi olduğuna karar vermek için sezgisel veya gevşek bir kurala ihtiyacı var.

Binlerce farklı görünüşte eşit derecede geçerli program oluşturulmuş olabilir. Bu buluşsal yöntem “en zayıf olanı seç” veya “en basiti seç” olabilir.

Ancak, eğer AlphaGo gibiyse, o zaman bir yapay zekanın buluşsal yöntem oluşturmasını sağladılar. AlphaGo için süreç buydu. Google, farklı hareket dizilerini diğerlerinden daha iyi veya daha kötü olarak derecelendirecek bir model geliştirdi.

Hala bilmediğimiz şey

O zaman soru şu: Bu gerçekten AGI’ye daha mı yakın? Eğer o3 bu şekilde çalışıyorsa, o zaman temel model önceki modellerden çok daha iyi olmayabilir.

Modelin dilden öğrendiği kavramlar genelleme için eskisinden daha uygun olmayabilir. Bunun yerine, bu teste özel bir buluşsal yöntemin eğitiminin ekstra adımlarında bulunan daha genelleştirilebilir bir “düşünce zinciri” görüyor olabiliriz. Kanıt her zaman olduğu gibi pudingde olacak.

O3 hakkında neredeyse her şey bilinmiyor. OpenAI’nin açıklaması birkaç medya sunumuyla ve bir avuç araştırmacıya, laboratuvara ve yapay zeka güvenlik kurumuna yapılan erken testlerle sınırlıydı.

O3’ün potansiyelini gerçekten anlamak, değerlendirmeler, kapasite dağılımının anlaşılması, ne sıklıkta başarısız olduğu ve ne sıklıkta başarılı olduğu gibi kapsamlı çalışmalar gerektirecektir.

o3 nihayet piyasaya sürüldüğünde, ortalama bir insan kadar uyum sağlayıp sağlamadığına dair çok daha iyi bir fikre sahip olacağız.

Eğer öyleyse, kendi kendini geliştiren hızlandırılmış zekanın yeni bir çağını başlatan devasa, devrim niteliğinde bir ekonomik etkiye sahip olabilir. YGZ’nin kendisi için yeni ölçütlere ve onun nasıl yönetilmesi gerektiğine dair ciddi değerlendirmelere ihtiyacımız olacak.

Değilse, o zaman bu yine de etkileyici bir sonuç olacaktır. Ancak günlük yaşam büyük ölçüde aynı kalacak.

Michael Timothy BennettDoktora Öğrencisi, Bilgisayar Fakültesi, Avustralya Ulusal Üniversitesi Ve Elija PerrierAraştırma Görevlisi, Stanford Sorumlu Kuantum Teknolojisi Merkezi, Stanford Üniversitesi

Bu makale şuradan yeniden yayınlanmıştır: Konuşma Creative Commons lisansı altındadır. Okuyun orijinal makale.

genel-7

OpenAI, Yeni Modelinin ‘Genel Zeka’ Testinde İnsan Seviyesine Ulaştığını İddia Ediyor. Bu ne anlama gelir?

Genelleme ve zeka

Izgaralar ve desenler

Zayıf kurallar ve adaptasyon

Düşünce zincirlerini mi arıyorsunuz?

Hala bilmediğimiz şey

Sanal Medya

Son Eklenenler

2023’te Veri Merkezleri Enerji Tüketimini Dörde Katlayacak

Kindle’lar Best Buy’da Büyük İndirimde!

Nvidia, AI Veri Merkezlerinde Her Çipi Kontrol Altına Almayı Amaçlıyor!

Nintendo Splatoon 4’ün Gelmesi İhtimalini Açıklıyor

Fortnite Yeni Güncellemesiyle Canlı Kreatör Oyunları Tanıtıyor

İran füzeleri Bahreyn’deki Amazon veri merkezini vurdu iddiası

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer