Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Xai, Grook 3’ün ölçütleri hakkında mı yalan söyledi?
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Xai, Grook 3’ün ölçütleri hakkında mı yalan söyledi?

Liste

Xai, Grook 3’ün ölçütleri hakkında mı yalan söyledi?

teknomers
Son güncelleme: 23 Şubat 2025 02:01
teknomers
Paylaş
Paylaş


Yapay zeka ölçütleri ve AI laboratuvarları tarafından nasıl bildirildikleri konusundaki tartışmalar kamuoyuna dökülüyor.

Bu hafta, bir openai çalışanı sanık Elon Musk’un AI şirketi Xai, en son AI modeli Groch 3. için yanıltıcı kıyaslama sonuçları yayınlamak için. Xai’nin kurucularından biri Igor Babushkin, ısrar etti Şirketin sağda olduğunu.

Gerçek aralarında bir yerde yatıyor.

Bir Xai’nin Blogunda GönderiŞirket, Grok 3’ün yeni bir Invitational Matematik Sınavından zorlu matematik soruları koleksiyonu olan AIME 2025’te performans gösteren bir grafik yayınladı. Bazı uzmanlar var AIE’in geçerliliğini bir AI ölçütü olarak sorguladı. Bununla birlikte, testin AIME 2025 ve daha eski sürümleri, bir modelin matematik yeteneğini araştırmak için yaygın olarak kullanılır.

Xai’nin grafiği, AIME 2025’te Openai’nin en iyi performans gösteren modeli O3-Mini-High, Openai’nin en iyi performans gösteren modeli O3-Mini-High’yi yenerek Grok 3, GROK 3 muhakeme beta ve GroK 3 Mini Akıl Yürütme’nin iki çeşidi gösterdi. O3-Mini-High’s AIME 2025 skorunu “Cons@64” e dahil etmedi.

Eksileri@64 nedir, sorabilirsiniz? “Consensus@64” için kısadır ve temel olarak bir model 64, her sorunu bir ölçütte cevaplamaya çalışır ve en sık üretilen cevapları son cevaplar olarak alır. Tahmin edebileceğiniz gibi,@64, modellerin kıyaslama puanlarını biraz artırma eğilimindedir ve bir grafikten atlamak, bir model gerçekte bir modelin bir diğerini aşıyormuş gibi görünmesini sağlayabilir, durum böyle değil.

GROK 3 Akıl Yürütme Beta ve GroK 3 Mini Akıl Yürütmesinin AIME 2025 için “@1” de puanları-yani modellerin ölçütte bulunduğu ilk puan-O3-Mini-High’nin puanının altına düşüyor. GROK 3 Akıl Yürütme Beta, Openai’nin O1 modelinin “orta” hesaplamaya ayarlandığı zamanın arkasında da ilerliyor. Yine de Xai Reklam Grok 3 “dünyanın en akıllı yapay zekası” olarak.

Babushkin x üzerinde tartışıldı Openai, kendi modellerinin performansını karşılaştıran grafikler de olsa, geçmişte benzer şekilde yanıltıcı kıyaslama çizelgeleri yayınladı. Tartışmada daha tarafsız bir parti, neredeyse her modelin@64’teki performansını gösteren daha “doğru” bir grafik oluşturdu:

Bazı insanların planımı Openai’ye saldırı ve diğerleri Grok’a saldırı olarak nasıl gördüklerinde, gerçekte Deepseek Propaganda
(Aslında GroK’ın orada iyi göründüğüne inanıyorum ve Openai’nin O3-Mini-*yüksek*-pass@”” ”1 ″” ”arkasındaki TTC Chicanery daha fazla incelemeyi hak ediyor.) https://t.co/djqljpcjh8 pic.twitter.com/3wh8fUicfic

– Teortaxes ▶ yan (Deepseek 推特🐋铁粉 2023 – ∞) (@teortaxestex) 20 Şubat 2025

Ancak AI araştırmacısı Nathan Lambert olarak bir gönderiye işaret ettibelki de en önemli metrik bir gizem olmaya devam ediyor: her modelin en iyi puanını elde etmesi için gereken hesaplama (ve parasal) maliyet. Bu sadece en çok AI kriterlerinin modellerin sınırlamaları ve güçlü yönleri hakkında ne kadar iletişim kurduğunu gösteriyor.





genel-24

iPhone 16 ve iPhone 16 Pro Max, Önceki Modellerden Daha Büyük Pillere Sahip Olabilir
ChatGPT kapalı – şu ana kadar kesinti hakkında bildiklerimiz:
NASA’nın Ezie Uyduları Auroral Elektrojeler ve Uzay Hava Durumu Çalışmaya Başlıyor
Şimdi oy verin: Ekran altı parmak izi tarayıcıları ve arkaya/yan tarafa monte edilenler
Apple’ın Tuhaf Aşırı Bulantı Noktaları Araba Tutmasını Giderdi mi?
ETİKETLENDİ:3ünGrokGrookHakkındamıölçütÖlçütleriOpenAIsöyledixaiyalan
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Kayıp Ruh Bir Kenar PC Gereksinimleri Açıklandı
Sonraki Makale Galaxy S25 Edge Hands, videoda ince tasarım ve anahtar özellikleri gösteriyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Apple ürünleri için bu yılki Prime Day indirimleri muhteşem
Liste
Sonic’in Yeni Kaos Avı Oyunu: Atlamamanız Gereken Detaylar
Oyun
Kritik: Xolis Sağlık Teknolojileri 1.4 Milyon Kişinin Verilerini Sızdırdı
Siber Güvenlik
2026 Amazon Prime Günü İndirimleri: Tushy Bidet 100$ Altında!
Genel
Hindistan’ın MoEngage’i Pazarlamanın Geleceği: Milyonlarca AI Ajanı
Genel
Acer’ın 4TB GM7 PCIe 4.0 SSD’si Prime Günü’nde 470$’a düştü
Donanım
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?