Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Çin yapay zeka modelleri, Hugging Face’in LLM chatbot kıyaslama sıralamasında fırtınalar estiriyor – ABD’deki büyük rakipler kötüleşirken Alibaba tahtayı yönetiyor
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Çin yapay zeka modelleri, Hugging Face’in LLM chatbot kıyaslama sıralamasında fırtınalar estiriyor – ABD’deki büyük rakipler kötüleşirken Alibaba tahtayı yönetiyor

Liste

Çin yapay zeka modelleri, Hugging Face’in LLM chatbot kıyaslama sıralamasında fırtınalar estiriyor – ABD’deki büyük rakipler kötüleşirken Alibaba tahtayı yönetiyor

teknomers
Son güncelleme: 28 Haziran 2024 09:17
teknomers
Paylaş
Paylaş



Hugging Face, kendi albümünü yayınladı ikinci LLM sıralama tablosu test ettiği en iyi dil modellerini sıralamak için. Yeni liderlik tablosu, çeşitli görevlerde açık büyük dil modeli (LLM) performansını test etmek için daha zorlu bir tekdüze standart olmayı hedefliyor. Alibaba’nın Qwen modelleri, liderlik tablosunun ilk sıralamalarında baskın görünüyor ve ilk onda üç sıra alıyor.

Yepyeni açık LLM liderlik tablosunu duyurmaktan heyecan duyuyoruz. Tüm büyük açık LLM’ler için MMLU-pro gibi yeni değerlendirmeleri tekrar çalıştırmak için 300 H100 harcadık! Biraz öğrenme:- Qwen 72B kraldır ve Çin açık modelleri genel olarak baskındır- Önceki değerlendirmeler son zamanlarda çok kolay hale geldi…26 Haziran 2024

Hugging Face’in ikinci liderlik tablosu dil modellerini dört görevde test eder: bilgi testi, aşırı uzun bağlamlarda akıl yürütme, karmaşık matematik becerileri ve talimat takibi. Bu nitelikleri test etmek için altı ölçüt kullanılır ve testler arasında 1.000 kelimelik cinayet gizemlerini çözme, doktora düzeyindeki soruları herkesin anlayabileceği şekilde açıklama ve en korkutucusu: lise matematik denklemleri bulunur. Kullanılan ölçütlerin tam bir dökümü şu adreste bulunabilir: Hugging Face’in blogu.

Yeni liderlik sıralamasında lider konumda olan Alibaba’nın LLM’si Qwen, az sayıda çeşidiyle 1., 3. ve 10. sırada yer alıyor. Ayrıca Llama3-70B, Meta’nın LLM’si ve paketten daha iyi performans göstermeyi başaran bir avuç daha küçük açık kaynaklı proje de yer alıyor. ChatGPT’nin herhangi bir belirtisinin olmaması dikkat çekicidir; Hugging Face’in skor tablosu, sonuçların tekrarlanabilirliğini sağlamak için kapalı kaynak modellerini test etmez.

Liderlik sıralamasına girmeye yönelik testler yalnızca Hugging Face’in kendi bilgisayarlarında yapılıyor; CEO Clem Delangue’un Twitter hesabına göre bu bilgisayarlar 300 adet Nvidia H100 GPU tarafından destekleniyor. Hugging Face’in açık kaynak ve işbirlikçi doğası nedeniyle, test için popüler yeni girişlere öncelik veren yeni bir oylama sistemi ile herkes test için ve liderlik tablosuna kabul edilmek üzere yeni modeller göndermekte özgürdür. Liderlik tablosu, kafa karıştırıcı küçük LLM bolluğunu önlemek için yalnızca önemli modellerin vurgulanmış bir dizisini gösterecek şekilde filtrelenebilir.

LLM alanının bir ayağı olarak Hugging Face, LLM öğrenimi ve topluluk iş birliği için güvenilir bir kaynak haline geldi. İlk liderlik tablosu geçen yıl birkaç yerleşik LLM’den test sonuçlarını karşılaştırma ve yeniden üretme aracı olarak yayınlandıktan sonra, tablo hızla popülerlik kazandı. Tabloda yüksek sıralara ulaşmak, küçük ve büyük birçok geliştiricinin hedefi haline geldi ve modeller genel olarak daha güçlü, daha ‘akıllı’ ve ilk liderlik tablosunun belirli testleri için optimize edildikçe, sonuçları giderek daha az anlamlı hale geldi, bu nedenle ikinci bir varyant oluşturuldu.

Meta’nın Llama’sının daha yeni varyantları da dahil olmak üzere bazı LLM’ler, birincideki yüksek notlarına kıyasla yeni liderlik tablosunda ciddi şekilde düşük performans gösterdi. Bu, LLM’leri yalnızca ilk liderlik tablosunun ölçütlerinde aşırı eğitme eğiliminden kaynaklandı ve gerçek dünya performansında gerilemeye yol açtı. Hiper spesifik ve kendi kendine referanslı veriler sayesinde bu performans gerilemesi, yapay zeka performansının zamanla kötüleşme eğilimini takip ediyor ve Google’ın yapay zeka yanıtlarının LLM performansının yalnızca eğitim verileri kadar iyi olduğunu ve gerçek yapay “zekanın” hala çok, çok yıllar uzakta olduğunu göstermesiyle bir kez daha kanıtlandı.

Tom’s Hardware’in en iyi haberlerini ve derinlemesine incelemelerini doğrudan gelen kutunuza alın.





genel-21

Amazon, Şubat ayından itibaren bazı müzik abonelik planlarının fiyatlarını artıracak
DOGE, Sosyal Güvenlik’in Eski Teknolojisini Modernleştirmek İstiyor — Başımıza Neler Gelebilir?
Twitter, Facebook, Instagram Profilleri Nasıl Güncellenir
Quad Gods röportajı: İlk tamamen quadriplejiklerden oluşan e-spor takımı oyun alanını eşitliyor
YouTube Premium, Daha Yüksek Ses Kalitesi, Daha Yüksek Oynatma Hızları Dahil Deneysel Özellikler Sunuyor
ETİKETLENDİ:ABDdekiAlibababüyükChatbotçinestiriyorFaceinfırtınalarHuggingkıyaslamaKötüleşirkenLLMModellerirakiplersıralamasındatahtayıYapayyönetiyorZeka
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Rus Vatandaşı 2022 İşgali Öncesinde Ukrayna’ya Yönelik Siber Saldırılar Nedeniyle Suçlandı
Sonraki Makale Mattel Oyunlarının Çoğunu Renk Körlerine Uygun Hale Getiriyor

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Acil: ServiceNow Açıklarıyla Müşteri Hesaplarına Yetkisiz Erişim!
Siber Güvenlik
Sahte Webhook’ları Durdurun: Laravel’de HMAC İmzalarını Ustalaşın 🛡️
Yazılım
Meta, Hindistan’da Reliance ile İlk AI Veri Merkezi Anlaşmasını İmzaladı
Genel
Logitech’in Yeni Mobi Fold Fark Yaratan Boyutuyla Özellik Sunuyor
Liste
Kritik: Microsoft Defender Açıkları ile Güncellenmiş Windows’a Erişim Sağlanıyor
Siber Güvenlik
Star Fox Deneyimini Bugün Yaşamak İçin Yeni Demo Yayında
Oyun
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?