LLaMA, ChatGPT veya Bing gibi değildir; kimsenin konuşabileceği bir sistem değil. Aksine, Meta’nın “bu önemli, hızla değişen alanda erişimi demokratikleştirme” umuduyla paylaştığını söylediği bir araştırma aracı. Başka bir deyişle: uzmanların, önyargı ve zehirlilikten basitçe bilgi uydurma eğilimlerine kadar yapay zeka dil modellerinin sorunlarını çözmelerine yardımcı olmak.
Bu amaçla Meta, üniversiteler, STK’lar ve endüstri laboratuvarları gibi gruplara erişim izni verilen LLaMA’yı (aslında tek bir sistem değil, farklı boyutlardaki dörtlü modellerden oluşan bir dörtlü) “araştırma kullanım durumlarına odaklanan ticari olmayan bir lisans” altında piyasaya sürüyor. .
Şirket gönderisinde, “Tüm AI topluluğunun – akademik araştırmacılar, sivil toplum, politika yapıcılar ve endüstri – genel olarak sorumlu AI ve özellikle sorumlu büyük dil modelleri hakkında net yönergeler geliştirmek için birlikte çalışması gerektiğine inanıyoruz” diye yazdı. “Topluluğun LLaMA kullanarak neler öğrenebileceğini – ve sonunda inşa edebileceğini – görmek için sabırsızlanıyoruz.”
İçinde bir araştırma makalesi, Meta, LLaMA modelinin en küçük ikinci versiyonu olan LLaMA-13B’nin “çoğu kıyaslamada” OpenAI’nin popüler GPT-3 modelinden daha iyi performans gösterdiğini, en büyüğü olan LLaMA-65B’nin ise “en iyi modellerle rekabet edebildiğini” iddia ediyor. DeepMind’ın Chinchilla70B’si ve Google’ın PaLM 540B’si gibi. (Bu isimlerdeki sayılar, her modeldeki milyarlarca parametreyi ifade eder – sistemin boyutunun bir ölçüsü ve karmaşıklığının kabaca bir tahminidir, ancak bu iki özellik mutlaka aynı adımda ölçeklenmez.)
LLaMA-13B, bir kez eğitildikten sonra tek bir veri merkezi sınıfı Nvidia Tesla V100 GPU üzerinde de çalışabilir. Bu, bu sistemler üzerinde testler yapmak isteyen küçük kurumlar için hoş bir haber olacak, ancak bu tür ekipmanların ulaşamayacağı yalnız araştırmacılar için pek bir şey ifade etmiyor.
Meta aslında geçmişte kendi erişilebilir AI sohbet robotlarını piyasaya sürdü, ancak resepsiyon yıldızlardan daha azdı. BlenderBot adlı biri, basit olduğu için eleştirildi… çok iyi değilbilimsel makaleler yazmak için tasarlanan Galactica adlı bir diğeri ise yalnızca üç gün sonra çevrimdışı duruma getirildi bilimsel saçmalıklar üretmeye devam ettikten sonra.
Meta, LLaMA dörtlüsü ile muhtemelen daha nazik bir karşılama umuyor.
CEO Mark Zuckerberg, “Bugün, araştırmacıların çalışmalarını ilerletmelerine yardımcı olmak için tasarlanmış, LLaMA adlı yeni, son teknoloji ürünü yapay zeka büyük dil modelini piyasaya sürüyoruz” dedi. Facebook gönderisinde söyledi. “LLM’ler metin oluşturma, konuşma yapma, yazılı materyali özetleme ve matematik teoremlerini çözme veya protein yapılarını tahmin etme gibi daha karmaşık görevlerde çok fazla umut vaat etti. Meta, bu açık araştırma modeline kendini adamıştır ve yeni modelimizi yapay zeka araştırma topluluğunun kullanımına sunacağız.”