Meta, Llama 3'ün Gemini dahil diğer birçok modeli geride bıraktığını söylüyor - Dünyadan Güncel Teknoloji Haberleri

Llama 3 şu anda 8B ve 70B parametrelerine sahip iki model ağırlığına sahiptir. (B milyarlar içindir ve bir modelin ne kadar karmaşık olduğunu ve eğitiminin ne kadarını anladığını temsil eder.) Şu ana kadar yalnızca metin tabanlı yanıtlar sunuyor, ancak Meta bunların “büyük bir sıçrama” olduğunu söylüyor önceki sürüme göre. Lama 3, yönlendirmeleri yanıtlamada daha fazla çeşitlilik gösterdi, sorulara yanıt vermeyi reddettiği durumlarda daha az hatalı ret cevabı verdi ve daha iyi mantık yürütebildi. Meta ayrıca Llama 3’ün eskisinden daha fazla talimatı anladığını ve daha iyi kod yazdığını söylüyor.

Gönderide, Meta, belirli kıyaslama testlerinde Llama 3’ün her iki boyutunun da Google’ın Gemma ve Gemini, Mistral 7B ve Anthropic’in Claude 3’ü gibi benzer boyutlu modelleri geride bıraktığını iddia ediyor. Genellikle genel bilgiyi ölçen MMLU değerlendirmesinde Llama 3 8B, Gemma 7B ve Mistral 7B’den önemli ölçüde daha iyi performans gösterirken, Llama 3 70B Gemini Pro 1.5’ten biraz daha üstün performans gösterdi.

(Meta’nın 2.700 kelimelik gönderisinde OpenAI’nin amiral gemisi modeli olan GPT-4’ten bahsetmemesi belki dikkate değerdir.)

Yapay zeka modellerinin kıyaslama testinin ne kadar güçlü olduklarının anlaşılmasına yardımcı olmasına rağmen kusurlu olduğu da unutulmamalıdır. Modelleri kıyaslamak için kullanılan veri kümelerinin, model eğitiminin bir parçası olduğu bulunmuştur; bu, modelin, değerlendiricilerin kendisine soracağı soruların yanıtlarını zaten bildiği anlamına gelir.

Karşılaştırma testi, Llama 3’ün her iki boyutunun da benzer boyutlu dil modellerinden daha iyi performans gösterdiğini gösteriyor.

Ekran Görüntüsü: Emilia David / The Verge

Meta diyor ki insan değerlendiriciler ayrıca Llama 3’ü OpenAI’nin GPT-3.5’i de dahil olmak üzere diğer modellerden daha yüksek olarak derecelendirdiler. Meta, insan değerlendiricilerin Llama 3’ün kullanılabileceği gerçek dünya senaryolarını taklit etmeleri için yeni bir veri seti oluşturduğunu söylüyor. Bu veri kümesi tavsiye isteme, özetleme ve yaratıcı yazma gibi kullanım örneklerini içeriyordu. Şirket, model üzerinde çalışan ekibin bu yeni değerlendirme verilerine erişiminin olmadığını ve bunun modelin performansını etkilemediğini söylüyor.

“Bu değerlendirme seti, 12 temel kullanım durumunu kapsayan 1.800 ipucu içerir: tavsiye istemek, beyin fırtınası, sınıflandırma, kapalı soru yanıtlama, kodlama, yaratıcı yazma, çıkarma, bir karakterin/kişiliğin yaşaması, açık soru yanıtlama, akıl yürütme, yeniden yazma ve özetleme, ” Meta blog yazısında diyor.

Meta, Lama 3’ün insan değerlendirmelerinde çoğu modelden daha iyi performans gösterdiğini söylüyor.

Ekran Görüntüsü: Emilia David / The Verge

Llama 3’ün daha büyük model boyutlarına sahip olması (daha uzun talimat ve veri dizilerini anlayabilmesi) ve “Bir görüntü oluştur” veya “Bir ses dosyasını yazıya dök” gibi daha çok modlu yanıtlar verebilmesi bekleniyor. Meta, 400 milyarın üzerinde parametreye sahip olan ve ideal olarak modelin daha küçük versiyonlarına göre daha karmaşık kalıpları öğrenebilen bu daha büyük versiyonların şu anda eğitimde olduğunu ancak ilk performans testlerinin, bu modellerin kıyaslama tarafından ortaya çıkan soruların çoğuna cevap verebileceğini gösterdiğini söylüyor.

Ancak Meta, bu daha büyük modellerin bir ön izlemesini yayınlamadı ve bunları GPT-4 gibi diğer büyük modellerle karşılaştırmadı.

genel-2

Meta, Llama 3’ün Gemini dahil diğer birçok modeli geride bıraktığını söylüyor

Byteknomers

By teknomers

Benzer İçerikler

Yönetici asistanları, yüksek maaşlar ve erken aşamadaki kurucuların başlangıç VC’sini tetiklemesinin diğer yolları

Squid Game’in Yaratıcısı 2. Sezonun Daha Fazla Acı Getireceğini Söyledi

Galaxy S24 FE, 199 $ indirimle bu Kara Cuma gününün Samsung hayranları için vazgeçilmez tercihi oluyor

TOKYOPOP, 2024 Tatil Sezonu İçin Disney Manga Başlıklarını Öne Çıkardı

XCOM 2 şimdiye kadar oynadığım en harika strateji oyunu ve bu yüzden

Avoved, Baldur’s Gate 3’ten daha çok Fallout 3’tür, ancak bu kötü bir şey değil

King of Meat, Dark Souls’un Fall Guys ile karıştırıldığı ortak bir oyundur ve erkenden deneyebilirsiniz

Çok sevilen Marshall Emberton II, Amazon’da cömert bir Kara Cuma indirimi alıyor

Sınırlı süreli satış, 512 GB Google Pixel 7 Pro’yu 400 doların altına düşürdü

Şimdi büyük bir indirim VE bir Amazon hediye kartıyla Galaxy Buds 3 Pro Black Friday tasarruflarınızı en üst düzeye çıkarın

CEO Carl Pei bize hiçbir şeyin nasıl Hiçbir Şeye dönüştüğünü anlatıyor

Bilim insanları Mars uzayında güneş enerjili yüksek enerjili protonların ilk tam enerji spektrumunu oluşturdular

Samanyolu diskinin etrafında ateşli gaz örtüsü ortaya çıktı

Bilim insanları, evrenimizi birbirinden ayıran karanlık enerjinin göründüğü gibi olmayabileceğini söylüyor

Saatte 2 milyon mil hızla gerçekleşen galaksi parçalanması benzeri görülmemiş ayrıntılarla görüldü

İlginizi Çekebilir

Yeni The Witcher 3 modu, yeni nesil sürüme yüksek kalite ve 4K dokular ekliyor

Yönetici asistanları, yüksek maaşlar ve erken aşamadaki kurucuların başlangıç VC’sini tetiklemesinin diğer yolları

Squid Game’in Yaratıcısı 2. Sezonun Daha Fazla Acı Getireceğini Söyledi

1,5K ekran, Snapdragon 8 Gen 3 ve 100 W. Honor 300 Pro’nun özellikleri galadan önce açıklandı