Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: YGZ testi çözülmeye daha yakın ancak kusurlu olabilir
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » YGZ testi çözülmeye daha yakın ancak kusurlu olabilir

Liste

YGZ testi çözülmeye daha yakın ancak kusurlu olabilir

teknomers
Son güncelleme: 10 Aralık 2024 05:15
teknomers
Paylaş
Paylaş


Yapay genel zekaya (AGI) yönelik iyi bilinen bir test çözülmeye daha yakın. Ancak testin yaratıcıları, bunun iyi niyetli bir araştırma atılımından ziyade testin tasarımındaki kusurlara işaret ettiğini söylüyor.

Yapay zeka dünyasının önde gelen isimlerinden Francois Chollet, 2019 yılında “Yapay Genel Zeka için Soyut ve Muhakeme Derlemi”nin kısaltması olan ARC-AGI kriterini tanıttı. Bir yapay zeka sisteminin, üzerinde eğitim aldığı veriler dışında yeni becerileri verimli bir şekilde kazanıp kazanamayacağını değerlendirmek için tasarlandı. ARC-AGIFrancois, genel zekaya doğru ilerlemeyi ölçen tek yapay zeka testi olmaya devam ettiğini iddia ediyor (her ne kadar diğerleri önerilmiştir.)

Bu yıla kadar en iyi performansı gösteren yapay zeka, ARC-AGI’deki görevlerin yalnızca üçte birinden azını çözebiliyordu. Chollet, endüstrinin gerçek anlamda “akıl yürütme” yeteneğine sahip olmadığına inandığı büyük dil modellerine (LLM’ler) odaklanılmasını suçladı.

“LLM’ler tamamen ezberlemeye dayandıkları için genelleme yapmakta zorlanıyorlar” söz konusu Şubat ayında X ile ilgili bir dizi gönderide. “Eğitim verilerinde bulunmayan her şeyi analiz ediyorlar.”

Chollet’e göre Yüksek Lisans’lar istatistiksel makinelerdir. Pek çok örnek üzerinde eğitim alarak, bir e-postada “kime” ifadesinin genellikle “ilgili olabilir” ifadesinden önce gelmesi gibi tahminlerde bulunmak için bu örneklerdeki kalıpları öğrenirler.

Chollet, yüksek lisans öğrencilerinin “muhakeme kalıplarını” ezberleme yeteneğine sahip olabilmelerine rağmen, yeni durumlara dayalı “yeni muhakeme” üretmelerinin pek mümkün olmadığını ileri sürüyor. Chollet, “Bir modelin birçok örneği üzerinde eğitim almanız gerekiyorsa (örtük olsa bile), yeniden kullanılabilir bir temsili öğrenmek için ezberliyorsunuz demektir” dedi. savundu başka bir yazıda.

Haziran ayında Chollet ve Zapier’in kurucu ortağı Mike Knoop, yüksek lisans eğitiminin ötesindeki araştırmaları teşvik etmek için 1 milyon dolarlık bir fon başlattı. yarışma ARC-AGI’yi yenebilecek açık kaynaklı yapay zeka oluşturmak. 17.789 başvurudan en iyileri, kazanmak için gereken %85’lik “insan seviyesi” eşiğinin altında olsa da, 2023’ün en skorer isminden %55,5 — ~%20 daha yüksek puan aldı.

Knoop, bunun AGI’ye ~%20 daha yakın olduğumuz anlamına gelmediğini söylüyor.

Bugün ARC Ödülü 2024’ün kazananlarını açıklıyoruz. Ayrıca yarışmadan öğrendiklerimiz hakkında kapsamlı bir teknik rapor yayınlıyoruz (bağlantı bir sonraki tweet’te).

Son teknoloji ürünü oran %33’ten %55,5’e çıktı; bu, 2020’den bu yana gördüğümüz en büyük tek yıllık artış.

— François Chollet (@fchollet) 6 Aralık 2024

bir blog yazısıKnoop, ARC-AGI’ye yapılan başvuruların çoğunun “kaba kuvvet” kullanarak çözüme ulaşabildiğini söyleyerek, ARC-AGI görevlerinin “büyük bir kısmının” “[don’t] genel zekaya yönelik çok yararlı sinyaller taşıyor.”

ARC-AGI, farklı renkli karelerden oluşan bir ızgara verildiğinde yapay zekanın doğru “cevap” ızgarasını oluşturması gereken bulmaca benzeri sorunlardan oluşur. Sorunlar, yapay zekayı daha önce görmediği yeni sorunlara uyum sağlamaya zorlamak için tasarlandı. Ancak bunu başardıkları belli değil.

ARC-AGI karşılaştırması
ARC-AGI kıyaslamasındaki görevler. Modeller en üst sıradaki ‘sorunları’ çözmelidir; alt satırda çözümler gösterilir. Resim Kredisi:ARC-AGI

“[ARC-AGI] Knoop, 2019’dan bu yana değişmediğini ve mükemmel olmadığını belirtti.

Francois ve Knoop da karşı karşıya geldi eleştiri AGI tanımının hararetle tartışıldığı bir dönemde, ARC-AGI’yi AGI’ye yönelik bir referans noktası olarak aşırı sattığı için. Yakın zamanda bir OpenAI personeli talep edildi Eğer YGZ yapay zekayı “çoğu görevde çoğu insandan daha iyi” olarak tanımlarsak, YGZ’nin “zaten” başarılmış olduğu söylenebilir.

Knoop ve Chollet, 2025 yarışmasının yanı sıra bu sorunları çözmek için ikinci nesil ARC-AGI kıyaslamasını da yayınlamayı planladıklarını söylüyor. Chollet, X’te şunları yazdı: “Araştırma topluluğunun çabalarını yapay zekadaki en önemli çözülmemiş sorunlar olarak gördüğümüz şeylere yönlendirmeye devam edeceğiz ve AGI’ye yönelik zaman çizelgesini hızlandıracağız.” postalamak.

Düzeltmeler muhtemelen kolay olmayacak. İlk ARC-AGI testinin eksiklikleri bir gösterge ise, yapay zeka için zekayı tanımlamak da bir o kadar zorlu olacaktır ve iltihaplı – tıpkı insanlar için olduğu gibi.





genel-24

Apple yıllarca yazılım desteği sunuyor, peki iPhone hayranları neden her iki yılda bir yükseltme yapıyor?
Juggernaut, Kendisini Tanrıya Dönüştürebilecek 1 Gücü Olduğunu Unuttu
Pixel Fold 2’nin Tensor G3’ü Atlayacağı Söyleniyor, Yeni Tensor G4 ve Diğer Önemli Yükseltmelerle Test Edileceği Söyleniyor
Google, üretici ve kabuktan bağımsız olarak çoğu Android akıllı telefonu %30 daha hızlı hale getirdi
İOS’ta üçüncü taraf bir Reddit uygulaması, onu kullanmak için sizden ayda 3,99 ABD doları ücret alacak
ETİKETLENDİ:ağıancakAraştırmaarc-agi kıyaslamasıark-agiÇalışmakÇözülmeyeDahaFrançois CholletistihbaratKalite Testikusurlumuhakemeolabilirtesttestiüretken yapay zekaYakınYapay genel zekayapay zekaYGZ
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Araştırmacılar DeepSeek ve Claude AI’deki Hızlı Enjeksiyon Güvenlik Açıklarını Ortaya Çıkardı
Sonraki Makale CCI, Amazon ve Flipkart Davalarını Hızlandırmak İçin Yüksek Mahkemede Duruşma İstiyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

2 Kişilik Hayal, Şimdi Yüksek Teknoloji Yerli Lazer Kesim ve Markalama Makineleri Üretiyor
Genel
1,479 $’lık Alienware oyuna hazır PC, RTX 5070 ve Ultra 7 CPU ile 4K destekli
Donanım
Meta Hindistan’ın CRED Kurucusu Kunal Shah’ı WhatsApp’a Atadı ve 900M Dolar Yatırımda Bulundu
Genel
Krabiyeleri Yönetmek İçin Hazırladığınız Kodlar (Haziran 2026)
Oyun
Kritik Uyarı: 29 Yaşındaki Squid Proxy Hatası HTTP İsteklerini Sızdırıyor
Siber Güvenlik
Apple’ın Yeni AirTag’leri Prime Günü’nde Rekor Fiyatlarla!
Liste
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?