Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Yazı Tipi BoyutlandırıcıAa
  • Anasayfa
  • Teknoloji
    • Siber Güvenlik
    • Yapay Zeka
    • Donanım
    • Bilim
  • Yazılım
  • Savunma & İstihbarat
  • Oyun
  • Yaşam
    • Finans
    • Sinema
    • Dünyadan Haberler
  • İş Birliği
Okuma: Alibaba’nın En Yeni Yapay Zekası Çoklu Karşılaştırma Testlerinde GPT-3.5 ve Claude’u Geride Bıraktı
Paylaş
Yazı Tipi BoyutlandırıcıAa
Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Ara
Bizi Takip Et
  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti
© 2026 Teknomers. All Rights Reserved.

Anasayfa » Alibaba’nın En Yeni Yapay Zekası Çoklu Karşılaştırma Testlerinde GPT-3.5 ve Claude’u Geride Bıraktı

Genel

Alibaba’nın En Yeni Yapay Zekası Çoklu Karşılaştırma Testlerinde GPT-3.5 ve Claude’u Geride Bıraktı

teknomers
Son güncelleme: 6 Şubat 2024 21:50
teknomers
Paylaş
Paylaş


Bu bir yatırım tavsiyesi değildir. Yazarın bahsi geçen hisse senetlerinin hiçbirinde pozisyonu bulunmamaktadır. Wccftech.com’un bir bilgilendirme ve etik politikası vardır.

2024 yılının küresel yapay zeka yarışına güçlü bir başlangıç ​​yapmasıyla birlikte Çinli teknoloji devi Alibaba Group, Qwen yapay zeka modelinin son versiyonunu da duyurdu. Dünyanın en iyi bilinen AI sohbet robotu olan OpenAI’nin ChatGPT’sinin yanı sıra, Meta’nın Llama’sı ve Amazon ortağı Anthropic’in Claude’u gibi diğer modeller, tüketicilerin ve işletmelerin kendi ihtiyaçlarına göre bir AI platformu seçerken sahip oldukları çeşitli seçeneklerdir.

Alibaba’nın en son Qwen yinelemesi Qwen 1.5’tir ve sosyal medya platformu X’te paylaşılan kıyaslamalara göre model, bazı kıyaslama puanlarında hem ChatGPT’yi hem de Claude’u geride bırakıyor.

Alibaba’nın Qwen 1.5’i, Öğretim Akışkanlığını Test Eden Çoklu Karşılaştırmalarda Claude ve ChatGPT’yi Geride Bırakıyor

Tıpkı bilgisayarlarda veya akıllı telefonlarda çalışan işletim sistemleri gibi yapay zeka modeli de bir yazılım parçasıdır. Bu, yazılım mühendislerinin ve analistlerin performansını değerlendirmesine olanak tanıyor ve Alibaba’nın en son Qwen 1.5’i söz konusu olduğunda, bazı puanlar Anthropic’in Claude ve OpenAI’nin ChatGPT’sinden daha iyi performans gösterdiğini gösteriyor.

İşletim sistemlerini test eden kıyaslamalar, talimatları işleme ve uygulamaları çalıştırma yeteneklerini değerlendirir ve yapay zeka modelleri için olanlar genellikle modellerin çıktı üretme yeteneğini test ederek bunların etrafında döner.

Bu tür iki kıyaslama MT-bench ve Alapaca-Eval’dir ve X’te paylaşılan puanlar, Alibaba’nın Qwen 1.5 versiyonunun ChatGPT ve Claude’u geride bıraktığını göstermektedir. MT-bench, bir modelin önceden tanımlanmış bir dizi soruyu yanıtlama yeteneğini test eder; bu, onu yalnızca sohbet robotundan ayırmaya çalışmakla kalmaz, aynı zamanda iki tarafın hızla etkileşime girdiği zorlu bir konuşma ortamında modelin ‘yerine dayanıp dayanamayacağını’ belirlemeye çalışır. birbirleriyle.

Karşılaştırma puanları, Qwen’in MT-bench’te dördüncü en yüksek puanı alan oyuncu olduğunu ve yalnızca GPT-4 Turbo ile ilk iki GPT-4 sürümünün (0613 ve 0314 sürümleri) gerisinde kaldığını gösteriyor.

Alibaba Qwen 1.5’i yayınladı

demo: https://t.co/goMcWMsIzT

En büyük açık kaynaklı Qwen1.5-72B-Chat, hem MT-Bench hem de Alpaca-Eval v2’de Claude-2.1, GPT-3.5-Turbo-0613’ü geride bırakarak üstün performans sergiliyor pic.twitter.com/50dNuUpEBx

— AK (@_akhaliq) 5 Şubat 2024

Alapaca-Eval, insan etkileşimlerini taklit etmek ve test edilen bir yapay zeka modelinin temel çizgiye uygun sonuçları ne ölçüde sağladığını belirlemek için bir referans modeli kullanan bir kıyaslamadır. Aynı zamanda kullanıcılara testlerini takip edebilecekleri bir liderlik tablosu da sağlıyor ve bugünkü kıyaslamalar Qwen 1.5’in Alapaca-Eval performansının yalnızca GPT-4 Turbo ve New York merkezli HuggingFace’in Yi-34B’nin gerisinde kaldığını gösteriyor.

Qwen1.5, türünün en büyük açık kaynak modellerinden biridir ve Alibaba’nın muazzam bilgi işlem kaynakları tarafından desteklenmektedir. Açık kaynaklı bir yapay zeka, açık kaynaklı yazılım gibi, kodunu kullanıcılar ve geliştiricilerin kullanımına sunar, böylece modeli anlayabilir ve kendi varyantlarını oluşturabilirler. Bugünkü skorlarda da yer alan Meta’nın Llama’sı da açık kaynaklı bir model.

2024’ün başında Wall Street ve şirketler, Meta, Microsoft ve Alphabet gibi büyük teknoloji devlerinin AI Earnings raporlarına odaklandı; hepsi AI Meta’nın şefi Mark Zuckerberg’in Llama’yı güçlendirmek için bu yıl milyonlarca GPU satın almayı hedeflediğine odaklandı ve firmanın kazanç açıklamasında yönetici, Meta’daki bilgi işlem kapasitesini artırma kararının, firmanın kapasitesinin altına düşmesine yol açan daha önceki gözetimlerin ardından geldiğini açıkladı.

Benzer şekilde, yonga üreticileri ve tasarımcılarından elde edilen kazançlar TSMC ve AMD de yönetimlerinin yapay zekanın geleceği konusunda iyimser olduklarını ifade etti. TSMC yönetimi, firmanın herhangi bir yapay zeka talebini karşılayabilecek sağlam bir temele sahip olduğundan eminken AMD, yapay zekanın eninde sonunda bu talebi karşılayabileceği görüşünde. on yılın sonunda yüz trilyonlarca dolar değerinde olacak.

Bu hikayeyi paylaş

Facebook

heyecan





genel-17

Bu muhteşem yeni OnePlus 12R fırsatı indirimli telefonu ücretsiz OnePlus Buds 3 ile birleştiriyor
Vaktinden önce: Instagram’ın Twitter rakibi* artık herkes tarafından kullanılabilir
AvtoVAZ, Lada Vesta istasyon vagonlarının üretimini durdurduğunu reddetti
Chevrolet, Özbekistan’ın en popüler otomobil markasıdır
Xiaomi’nin En İyi Kapı Kilidi Açıklandı
ETİKETLENDİ:AlibabanınbıraktıClaudeuÇoklugerideGPT3.5KarşılaştırmatestlerindeYapayYenizekası
Bu Makaleyi Paylaş
Facebook Bağlantıyı Kopyala Yazdır
Paylaş
Önceki Makale Apple kurumsal cihaz yönetimini Vision Pro’ya getiriyor
Sonraki Makale Yeni Nier Oyununun İptal Edildiği Bildirildi Ama Endişelenmeyin

Sanal Medya

FacebookBeğen
452Takip Et
PinterestSabitle
237Takip Et

Son Eklenenler

Uber Londra’yı Robotaksilere Hazırlanması İçin Uyardı
Liste
Acil: Oxford Üniversitesi Veri İhlalini Açıkladı!
Siber Güvenlik
Lenovo IdeaPad Slim 5x İncelemesi: 1.000 Dolar Altında En İyi Dizüstü Bilgisayar!
Genel
Yöneticiler, belirsiz yapay zeka için istihdamı küçültüyor
Donanım
Arc Raiders’ın Karanlık Yüzü: Unutulmaz Bir Deneyim Sizi Bekliyor
Oyun
Robotaksi Savaşı: Uber, Wayve ve Waymo Londra’da Karşılaşıyor
Genel
//

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

  • Hakkımızda
  • Gizlilik politikası
  • Tanıtım Yazısı ve Backlink Hizmeti

Kategoriler

  • Teknoloji
  • Oyun
  • Sinema
  • Siber Güvenlik
  • Bilim
  • Finans
  • Dünyadan Güncel Haberler

Populer

  • TV'de Ücretsiz İzlenebilen Şifresiz Erotik Kanallar (2025 Güncel Frekans Listesi)

  • The Last of Us PC Kontrolleri: Hızlı Silah Değiştirme ve Tüm Tuşlar (2025)

  • Hogwarts Legacy'de Odaklanma İksiri Nasıl Yapılır?

Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor HaberleriTeknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film | Spor Haberleri
Bizi Takip Et
© 2026 Teknomers. All Rights Reserved.
Welcome Back!

Sign in to your account

Kullanıcı Adı veya E-posta Adresi
Şifre

Şifrenizi mi unuttunuz?