Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Epoch AI, Yapay Zeka Modellerinin Yeteneklerini Test Etmek İçin FrontierMath AI Benchmark’ı Başlattı
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Epoch AI, Yapay Zeka Modellerinin Yeteneklerini Test Etmek İçin FrontierMath AI Benchmark’ı Başlattı

Liste

Epoch AI, Yapay Zeka Modellerinin Yeteneklerini Test Etmek İçin FrontierMath AI Benchmark’ı Başlattı

teknomers
Son güncelleme: 12 Kasım 2024 17:06
teknomers
Paylaş
Paylaş


Kaliforniya merkezli bir araştırma enstitüsü olan Epoch AI, geçen hafta yeni bir yapay zeka (AI) kıyaslaması başlattı. FrontierMath olarak adlandırılan yeni AI kıyaslaması, büyük dil modellerinin (LLM’ler) yeniden düzenleme ve matematiksel problem çözme yeteneklerini test ediyor. Yapay zeka firması, veri kirliliği ve yapay zeka modellerinin çok yüksek puanlar alması gibi faktörler nedeniyle mevcut matematik kıyaslamalarının pek kullanışlı olmadığını iddia ediyor. Epoch AI, önde gelen LLM’lerin bile yeni kıyaslamada yüzde ikiden daha az puan aldığını iddia ediyor.

Epoch AI FrontierMath Benchmark’ı Başlattı

bir postalamak AI firması, X’te (eski adıyla Twitter olarak biliniyordu) yüzlerce köken ve yayınlanmamış matematik problemi oluşturmak için 60’tan fazla matematikçiyle işbirliği yaptığını açıkladı. Epoch AI, bu soruların çözülmesinin matematikçilerin bile saatlerini alacağını iddia ediyor. Yeni kriterin geliştirilmesinin arkasındaki nedenin, AI modellerinin genellikle yüksek puan aldığı GSM8K ve MATH gibi mevcut kriterlerin sınırlamaları olduğu belirtildi.

Şirket, LLM’lerin elde ettiği yüksek puanların büyük ölçüde veri kirliliğinden kaynaklandığını iddia etti. Bu, soruların bir şekilde zaten yapay zeka modellerine beslendiği ve soruların kolayca çözülmesine olanak sağladığı anlamına geliyor.

FrontierMath, benzersiz ve hiçbir yerde yayınlanmamış yeni problemleri dahil ederek sorunu çözer ve veri kirliliğiyle ilişkili riskleri azaltır. Ayrıca kıyaslama, sayı teorisi, gerçek analiz ve cebirsel geometrideki hesaplama açısından yoğun problemlerin yanı sıra Zermelo-Fraenkel küme teorisi gibi konuları da içeren çok çeşitli soruları içerir. Yapay zeka firması, tüm soruların “tahmin kanıtı” olduğunu, yani güçlü bir mantık yürütmeden kazara çözülemeyeceklerini söylüyor.

Epoch AI, yapay zekanın yeteneğini ölçmek için, yapay zekanın birden fazla adımda akıl yürütmeyi sürdürmesi gereken yaratıcı problem çözme konusunda kıyaslamaların oluşturulması gerektiğini vurguladı. Özellikle sektör emektarlarının çoğu, mevcut kriterlerin bir yapay zeka modelinin ne kadar gelişmiş olduğunu doğru bir şekilde ölçmek için yeterli olmadığına inanıyor.

Yeni kıyaslamaya yanıt olarak postalamakŞirketin o1 modelinin arkasında yer alan OpenAI araştırmacısı Noam Brown, yeni kriteri memnuniyetle karşıladı ve şunları söyledi: “Öncü modeller için bu kadar düşük geçiş oranlarına sahip yeni bir değerlendirme görmeyi seviyorum.”

En son teknoloji haberleri ve incelemeleri için Gadgets 360’ı takip edin X, Facebook, WhatsApp, Konular Ve Google Haberler. Cihazlar ve teknolojiyle ilgili en son videolar için abone olun YouTube kanalı. En iyi etkileyiciler hakkında her şeyi bilmek istiyorsanız şirket içi bölümümüzü takip edin O Kim360 Açık instagram Ve YouTube.

Poco X7 Pro, Xiaomi’nin HyperOS 2’siyle Hindistan’da Gönderilen İlk Akıllı Telefon Olabilir


iQOO 13 Renk Seçenekleri 3 Aralık’ta Hindistan’da Lansman Öncesi Ortaya Çıktı





genel-8

Aembit, iş yüklerine kimlik yönetimi getirmek için 16,6 milyon dolar artırdı
Mühendis eski 3D yazıcıyı kesinlikle evde kullanmamanız gereken bir dövme tabancasına dönüştürüyor
Apple Sonunda Orijinal 12 İnç MacBook’u Haziran Sonuna Kadar Kullanımdan Kaldırıyor
mortal kombat: Mortal Kombat 12, serinin 30. yılını kutlayan bir videoda tanıtıldı: Ne beklemeli?
NASA asteroit riskini düşürür 2024 yr4 etkisi
ETİKETLENDİ:başlattıBenchmarkıEpochepoch ai frontiermath kıyaslama testi büyük dil modellerini başlattı epoch aiEtmekFrontierMathiçinmodellerinintestYapayyapay zekayapay zeka karşılaştırmasıYetenekleriniZeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Nvidia Uygulaması sürüm 1.0 dönüm noktasına ulaşıyor ve betadan çıkıyor — GeForce Experience yakında kullanımdan kaldırılabilir
Sonraki Makale LG Display’in gerilebilir ekranı artık daha da esnek

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Görkemli Bir Yaratım: Japon Gotik Korku Masalı
Liste
Anycubic Photon Mono 4, 190$ altına düştü; 50$ tasarruf et!
Donanım
Yeni Assassin’s Creed Black Flag ile Edward Kenway’ı Yeniden Keşfedin
Oyun
Saldırılar, İfşa ve Fidye: 2026’nın En Kötü Veri İhlalleri
Genel
Sanal İşletim Sistemi Müzesi ile 600’den Fazla OS Deneyimleyin
Liste
Acil! C0XMO Botnet, DD-WRT Açığını Kullanarak Rakip Kötü Amaçlı Yazılımları Yok Ediyor
Siber Güvenlik
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?