Meta'nın küçük LLaMA modelinin AI araştırmacıları için büyük faydaları var - Dünyadan Güncel Teknoloji Haberleri

Büyük dil modelleri teknoloji dünyasını kasıp kavurdu. Artık sorunları çözebilen, soruları yanıtlayabilen, tahminler yapabilen ve daha fazlasını yapabilen ChatGPT ve diğer konuşma modelleri gibi yapay zeka araçlarını destekliyorlar. Bununla birlikte, bu araçları kullanmanın önemli riskleri vardır: Makul ancak yanlış iddialarda bulundukları, toksik içerik ürettikleri ve hatta yapay zeka eğitim verilerine gömülü önyargıları taklit ettikleri bilinmektedir.

Araştırmacıların bu sorunları çözmelerine yardımcı olmak için Meta, geçen Cuma yayınlanacağını duyurdu adı verilen yeni bir geniş dil modelinin LLaMA (Büyük Dil Modeli Meta AI). Şirket, araştırma kullanım durumlarına odaklanan ticari olmayan bir lisans altında kullanıma sunuyor ve duruma göre erişim vermeyi planlıyor. Akademik araştırmacılar, devlet kurumları, sivil toplum ve akademi ile bağlantılı bireyler ve dünya çapındaki endüstriyel araştırma laboratuvarları tarafından erişilebilir olacaktır.

LLaMA ile ilginç olan şey, nispeten küçük olmasıdır.

Meta kullanılan “belirteçler”

Adından da anlaşılacağı gibi, büyük dil modelleri oldukça büyüktür. Bu dildeki sorunları çözecek, cevaplar bulacak veya kendi bestelerinizi oluşturacak kadar gelişmiş bir yapay zeka modeli oluşturmak için çok büyük miktarda dil verisi (konuşma dili, bilgisayar kodu, genetik veriler veya diğer “diller”) gerekir.

Meta, “LLaMA gibi daha küçük temel modellerin eğitimi, büyük dil modelleri için arzu edilir çünkü yeni yaklaşımları test etmek, başkalarının çalışmalarını doğrulamak ve yeni kullanım durumlarını keşfetmek için çok daha az hesaplama gücü ve kaynak gerektirir.”

Nispeten “küçük” bir LLM oluşturmak için Meta, “belirteçler” kullandı – tam kelimeler yerine kelime parçaları. Meta, LLaMA’yı Latin veya Kiril alfabesine sahip metinlere odaklanarak, en fazla sayıda konuşmacıya sahip 20 dilden metinler konusunda eğitti.

Çeşitli boyutlar mevcuttur

LLaMA aslında 7 ila 65 milyar parametre arasında değişen bir model koleksiyonudur. LLaMA 65B ve LLaMA 33B, 1,4 trilyon jetonla eğitilirken, en küçük model olan LLaMA 7B, bir trilyon jetonla eğitildi. Modeller yalnızca halka açık veri kümeleri kullanılarak eğitildi.

Küçük olmalarına rağmen, LLaMA modelleri güçlüdür. Meta, LLaMA-13B’nin çoğu kıyaslamada GPT-3’ten (175B) daha iyi performans gösterdiğini, LLaMA-65B’nin ise en iyi modeller olan Chinchilla70B ve PaLM-540B ile rekabet ettiğini söyledi.

LLaMA ayrıca bir temel model seti olarak da değerlidir. Temel modeller, etiketlenmemiş veriler üzerinde eğitilir, bu da çok çeşitli kullanım durumlarına uyarlanabilecekleri anlamına gelir.

Meta, LLaMA’yı birden çok boyutta (7B, 13B, 33B ve 65B ayarları) kullanılabilir hale getirecek ve aynı zamanda bir LLAMA modelini paylaşacaktır. kart modelin nasıl inşa edildiğini gösteren ayrıntılar. Şirket ayrıca, araştırmacıların LLaMA’nın sınırlamalarını anlayabilmeleri ve bu alanlarda araştırmaları ilerletebilmeleri için model yanlılığını ve toksisitesini değerlendiren bir dizi kıyaslama değerlendirmesi sağlıyor.

Kaynak : “ZDNet.com”

genel-15

Meta’nın küçük LLaMA modelinin AI araştırmacıları için büyük faydaları var

Byteknomers

Meta kullanılan “belirteçler”

Çeşitli boyutlar mevcuttur

By teknomers

Benzer İçerikler

NASA, Uzay Aracında ‘Tutarsız’ Siber Güvenlikle Karşı Karşıya

NYT Strands bugün – 5 Mayıs Pazar için ipuçları, cevaplar ve spangram (oyun #63)

Radeon RX 7900 XT, Ryzen 7 8700G’den 8 Kat Daha Hızlı

Apex Legends, Yetenekleri Değiştiriyor ve “Upheaveal”dan Neler Beklenecek?

Star Wars The Acolyte’ın Resmi Fragmanı Geliyor

Sızan Marvel’s Wolverine PS5 Test Oynanış Özellikleri Açılış Ara Sahnesi, Patron Dövüşleri, Öfke Modu ve Daha Fazlası

Ark Survival Ascending en iyi dinozor modlarını resmileştiriyor

iPhone için ekran altı Face ID’nin geciktiği bildirildi (yine)

Mystery premium segment ABD akıllı telefonu, amiral gemisi MediaTek yonga setinden güç alacak

Snapdragon 8 Gen 4, performansta büyük bir sıçrama olabilir ancak Apple A18 Pro’yu geçemez

Hayranların favorisi JBL Flip 5, bu harika fırsat sayesinde sıcak kek gibi satılıyor

MIT Yeni Bir Uzay Molekülünü Keşfetti

Boeing’in Starliner’ı seçkin ABD uzay gemileri kulübüne katıldı

Boeing’in Starliner’ı nihayet ilk mürettebatlı göreve hazır

NASA ve Boeing Tarihi Starliner Test Görevine “Gidiyor”

İlginizi Çekebilir

NASA, Uzay Aracında ‘Tutarsız’ Siber Güvenlikle Karşı Karşıya

NYT Strands bugün – 5 Mayıs Pazar için ipuçları, cevaplar ve spangram (oyun #63)

Radeon RX 7900 XT, Ryzen 7 8700G’den 8 Kat Daha Hızlı

Mod, ROG Ally’yi günümüzün Nintendo DS’sine dönüştürüyor — ikinci ekran aynı zamanda elde taşınan oyun konsolu için bir stand görevi görüyor