Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: OpenAI, Yeni Modelinin ‘Genel Zeka’ Testinde İnsan Seviyesine Ulaştığını İddia Ediyor. Bu ne anlama gelir?
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » OpenAI, Yeni Modelinin ‘Genel Zeka’ Testinde İnsan Seviyesine Ulaştığını İddia Ediyor. Bu ne anlama gelir?

Liste

OpenAI, Yeni Modelinin ‘Genel Zeka’ Testinde İnsan Seviyesine Ulaştığını İddia Ediyor. Bu ne anlama gelir?

teknomers
Son güncelleme: 29 Aralık 2024 15:40
teknomers
Paylaş
Paylaş


Contents
  • Genelleme ve zeka
  • Izgaralar ve desenler
  • Zayıf kurallar ve adaptasyon
  • Düşünce zincirlerini mi arıyorsunuz?
  • Hala bilmediğimiz şey

Yeni bir yapay zeka (AI) modeli yakın zamanda ortaya çıktı insan düzeyinde sonuçlar elde edildi “Genel zekayı” ölçmek için tasarlanmış bir testte.

20 Aralık’ta OpenAI’nin o3 sistemi %85 puan aldı. ARC-AGI karşılaştırmasıBu, önceki AI en iyi puanı olan %55’in çok üzerinde ve ortalama insan puanıyla aynı seviyede. Ayrıca çok zor bir matematik testinde de iyi puan aldı.

Yapay genel zeka veya AGI yaratmak, tüm büyük yapay zeka araştırma laboratuvarlarının belirtilen hedefidir. İlk bakışta OpenAI en azından bu hedefe yönelik önemli bir adım atmış gibi görünüyor.

Şüphecilik devam etse de birçok yapay zeka araştırmacısı ve geliştiricisi bir şeylerin değiştiğini düşünüyor. Çoğu kişi için YGZ’nin geleceği artık beklenenden daha gerçek, acil ve daha yakın görünüyor. Haklılar mı?

Genelleme ve zeka

o3 sonucunun ne anlama geldiğini anlamak için ARC-AGI testinin neyle ilgili olduğunu anlamanız gerekir. Teknik açıdan bu, bir yapay zeka sisteminin yeni bir şeye uyum sağlamadaki “örnek verimliliği”nin (sistemin nasıl çalıştığını anlamak için yeni bir durumun kaç örneğini görmesi gerektiğinin) testidir.

ChatGPT (GPT-4) gibi bir yapay zeka sistemi örnek açısından pek verimli değildir. Milyonlarca insan metni örneği üzerinde “eğitildi” ve hangi kelime kombinasyonlarının en muhtemel olduğuna ilişkin olasılıksal “kurallar” oluşturuldu.

Sonuç ortak görevlerde oldukça iyidir. Sıra dışı görevlerde kötüdür çünkü bu görevlerle ilgili daha az veriye (daha az örnek) sahiptir.

Yapay zeka sistemleri az sayıdaki örneklerden öğrenip daha fazla örnek verimliliğiyle uyum sağlayana kadar, yalnızca çok tekrarlanan ve ara sıra yaşanan hataların tolere edilebildiği işler için kullanılacaktır.

Sınırlı veri örneklerinden daha önce bilinmeyen veya yeni problemleri doğru bir şekilde çözme yeteneği, genelleme kapasitesi olarak bilinir. Yaygın olarak zekanın gerekli, hatta temel bir unsuru olarak kabul edilir.

Izgaralar ve desenler

ARC-AGI kıyaslama testi, aşağıdaki gibi küçük ızgara karesi problemlerini kullanarak örnek verimli uyarlamayı test eder. Yapay zekanın soldaki ızgarayı sağdaki ızgaraya dönüştüren modeli bulması gerekiyor.

Siyah ızgara arka planında renkli karelerden oluşan çeşitli desenler.
ARC-AGI kıyaslama testinden örnek bir görev.
ARC Ödülü

Her soruda öğrenilecek üç örnek verilmektedir. Yapay zeka sisteminin daha sonra üç örnekten dördüncüye kadar “genelleyen” kuralları bulması gerekiyor.

Bunlar bazen okuldan hatırlayabileceğiniz IQ testlerine çok benzer.

Zayıf kurallar ve adaptasyon

OpenAI’nin bunu nasıl yaptığını tam olarak bilmiyoruz, ancak sonuçlar o3 modelinin son derece uyarlanabilir olduğunu gösteriyor. Sadece birkaç örnekten genelleştirilebilecek kurallar buluyor.

Bir model ortaya çıkarmak için gereksiz varsayımlarda bulunmamalı veya gerçekte olmamız gerekenden daha spesifik olmamalıyız. İçinde teoriİstediğinizi yapan “en zayıf” kuralları belirleyebilirseniz, yeni durumlara uyum sağlama yeteneğinizi en üst düzeye çıkarmışsınız demektir.

En zayıf kurallardan neyi kastediyoruz? Teknik tanım karmaşıktır ancak daha zayıf kurallar genellikle uygulanabilen kurallardır. daha basit ifadelerle açıklanmıştır.

Yukarıdaki örnekte, kuralın sade İngilizce ifadesi şöyle olabilir: “Çıkıntılı bir çizgiye sahip herhangi bir şekil, bu çizginin sonuna doğru hareket edecek ve örtüştüğü diğer şekilleri ‘örtecektir’.”

Düşünce zincirlerini mi arıyorsunuz?

OpenAI’nin bu sonuca nasıl ulaştığını henüz bilmiyor olsak da, zayıf kuralları bulmak için o3 sistemini kasıtlı olarak optimize etmeleri pek mümkün görünmüyor. Ancak ARC-AGI görevlerinde başarılı olmak için onları bulmak gerekir.

OpenAI’nin o3 modelinin genel amaçlı bir versiyonuyla başladığını (bu, diğer modellerin çoğundan farklıdır, çünkü zor sorular hakkında “düşünmeye” daha fazla zaman ayırabilir) ve ardından onu özel olarak ARC-AGI testi için eğittiğini biliyoruz.

Karşılaştırmayı tasarlayan Fransız yapay zeka araştırmacısı Francois Chollet, inanıyor o3, görevi çözmek için gereken adımları açıklayan farklı “düşünce zincirlerini” araştırır. Daha sonra gevşek bir şekilde tanımlanmış bir kurala veya “sezgisel yönteme” göre “en iyiyi” seçecektir.

Bu, Google’ın AlphaGo sisteminin dünya Go şampiyonunu yenmek için farklı olası hamle dizilerini aramasından “farklı değil”.

Bu düşünce zincirlerini örneklere uyan programlar gibi düşünebilirsiniz. Elbette, eğer Go oynayan yapay zeka gibiyse, hangi programın en iyi olduğuna karar vermek için sezgisel veya gevşek bir kurala ihtiyacı var.

Binlerce farklı görünüşte eşit derecede geçerli program oluşturulmuş olabilir. Bu buluşsal yöntem “en zayıf olanı seç” veya “en basiti seç” olabilir.

Ancak, eğer AlphaGo gibiyse, o zaman bir yapay zekanın buluşsal yöntem oluşturmasını sağladılar. AlphaGo için süreç buydu. Google, farklı hareket dizilerini diğerlerinden daha iyi veya daha kötü olarak derecelendirecek bir model geliştirdi.

Hala bilmediğimiz şey

O zaman soru şu: Bu gerçekten AGI’ye daha mı yakın? Eğer o3 bu şekilde çalışıyorsa, o zaman temel model önceki modellerden çok daha iyi olmayabilir.

Modelin dilden öğrendiği kavramlar genelleme için eskisinden daha uygun olmayabilir. Bunun yerine, bu teste özel bir buluşsal yöntemin eğitiminin ekstra adımlarında bulunan daha genelleştirilebilir bir “düşünce zinciri” görüyor olabiliriz. Kanıt her zaman olduğu gibi pudingde olacak.

O3 hakkında neredeyse her şey bilinmiyor. OpenAI’nin açıklaması birkaç medya sunumuyla ve bir avuç araştırmacıya, laboratuvara ve yapay zeka güvenlik kurumuna yapılan erken testlerle sınırlıydı.

O3’ün potansiyelini gerçekten anlamak, değerlendirmeler, kapasite dağılımının anlaşılması, ne sıklıkta başarısız olduğu ve ne sıklıkta başarılı olduğu gibi kapsamlı çalışmalar gerektirecektir.

o3 nihayet piyasaya sürüldüğünde, ortalama bir insan kadar uyum sağlayıp sağlamadığına dair çok daha iyi bir fikre sahip olacağız.

Eğer öyleyse, kendi kendini geliştiren hızlandırılmış zekanın yeni bir çağını başlatan devasa, devrim niteliğinde bir ekonomik etkiye sahip olabilir. YGZ’nin kendisi için yeni ölçütlere ve onun nasıl yönetilmesi gerektiğine dair ciddi değerlendirmelere ihtiyacımız olacak.

Değilse, o zaman bu yine de etkileyici bir sonuç olacaktır. Ancak günlük yaşam büyük ölçüde aynı kalacak.Konuşma

Michael Timothy BennettDoktora Öğrencisi, Bilgisayar Fakültesi, Avustralya Ulusal Üniversitesi Ve Elija PerrierAraştırma Görevlisi, Stanford Sorumlu Kuantum Teknolojisi Merkezi, Stanford Üniversitesi

Bu makale şuradan yeniden yayınlanmıştır: Konuşma Creative Commons lisansı altındadır. Okuyun orijinal makale.



genel-7

Steam Deck, Microsoft Edge’in gücüyle Xbox Cloud Gaming’i alıyor
Çılgın TMNT Figürü Michelangelo’yu Gundam’a Dönüştürüyor
Fransızlar üretken yapay zeka konusunda ortalamadan daha az hevesli
Fire Emblem Engage İçin Yeni Bir Fragman Geldi!
Samsung Galaxy S24 Ultra, Apple iPhone 14 Pro’dan daha mı parlak parlıyor?
ETİKETLENDİ:AnlamaediyorGelirGeneliddiainsanmodelininOpenAISeviyesinetestindeulaştığınıyapay zekaYeniZeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Çinli perakendeci GeForce RTX 5090’ı 2.600 dolardan fiyatlandırıyor
Sonraki Makale Intel’in 2025’e Kadar Üretkenlik Pazarlarını Hedefleyen 24 GB Bellekli Battlemage GPU Modelini Piyasaya Süreceği Söylentileri

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil! IKEv1’deki Kritik Check Point VPN Açığıyla Şifreler Aşıldı
Siber Güvenlik
Bağımlılığı silerek bir destek masası oluşturdum.
Yazılım
WhatsApp NSO Grubu ile bağlantılı yeni casus yazılım saldırılarını tespit etti
Genel
Eero Pro 6E Router’lar 2026’nın En Düşük Fiyatında!
Liste
Watch Duty, Yangın Uygulamasına Sel Uyarıları Ekliyor!
Genel
Veri merkezi CPU talebi arttı; AI ajansları ve CPU-GPU oranı önem kazandı
Donanım
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?