Günümüzdeki her büyük teknoloji şirketi gibi Meta’nın da kendine ait bir amiral gemisi üretken yapay zeka modeli var. Lama. Llama, “açık” olması bakımından başlıca modeller arasında bir nebze benzersizdir, yani geliştiriciler onu istedikleri gibi indirip kullanabilirler (belirli sınırlamalarla). Bu, Anthropic’in Claude, OpenAI’nin GPT-4o (ChatGPT’yi destekler) ve yalnızca API’ler aracılığıyla erişilebilen Google’ın Gemini gibi modellerle tezat oluşturmaktadır.

Ancak geliştiricilere seçim hakkı vermek amacıyla Meta, Llama’nın bulutta barındırılan sürümlerini kullanılabilir hale getirmek için AWS, Google Cloud ve Microsoft Azure gibi satıcılarla da ortaklık kurdu. Ayrıca şirket, modeli ince ayarlamayı ve özelleştirmeyi kolaylaştırmak için tasarlanmış araçlar yayınladı.

İşte Llama hakkında bilmeniz gereken her şey, yeteneklerinden ve sürümlerinden onu nerede kullanabileceğinize kadar. Meta yükseltmeleri yayınladıkça ve modelin kullanımını desteklemek için yeni geliştirme araçları tanıttıkça bu gönderiyi güncel tutacağız.

Lama Nedir?

Lama bir model ailesidir; sadece bir model değil:

  • Lama 8B
  • Lama 70B
  • Lama 405B

En son sürümler şunlardır: Lama 3.1 8B, Lama 3.1 70B Ve Lama 3.1 405BTemmuz 2024’te piyasaya sürüldü. Çeşitli dillerdeki web sayfaları, web’deki genel kodlar ve dosyalar ve ayrıca sentetik veriler (yani diğer AI modelleri tarafından üretilen veriler) üzerinde eğitiliyorlar.

Llama 3.1 8B ve Llama 3.1 70B, dizüstü bilgisayarlardan sunuculara kadar çeşitli cihazlarda çalışmak üzere tasarlanmış küçük, kompakt modellerdir. Öte yandan Llama 3.1 405B, (bazı değişiklikler hariç) veri merkezi donanımı gerektiren büyük ölçekli bir modeldir. Llama 3.1 8B ve Llama 3.1 70B, Llama 3.1 405B’den daha az yeteneklidir, ancak daha hızlıdır. Aslında, düşük depolama yükü ve gecikme için optimize edilmiş, 405B’nin “damıtılmış” sürümleridir.

Tüm Llama modelleri 128.000 jetonluk bağlam pencerelerine sahiptir. (Veri biliminde, jetonlar ham verilerin alt bölümlere ayrılmış parçalarıdır, “fantastik” kelimesindeki “fan”, “tas” ve “tic” heceleri gibi.) Bir modelin bağlamı veya bağlam penceresi, modelin çıktı (örneğin ek metin) üretmeden önce dikkate aldığı giriş verilerini (örneğin metin) ifade eder. Uzun bağlam, modellerin son belgelerin ve verilerin içeriğini “unutmasını” ve konudan sapmasını ve yanlış çıkarımlarda bulunmasını önleyebilir.

Bu 128.000 jeton yaklaşık 100.000 kelimeye veya 300 sayfaya denk geliyor ki bu da “Uğultulu Tepeler”, “Gulliver’in Gezileri” ve “Harry Potter ve Azkaban Tutsağı” kitaplarının uzunluğuna yakın.

Lama ne yapabilir?

Diğer üretken AI modelleri gibi Llama da kodlama ve temel matematik sorularını yanıtlama ve sekiz dilde (İngilizce, Almanca, Fransızca, İtalyanca, Portekizce, Hintçe, İspanyolca ve Tayca) belgeleri özetleme gibi çeşitli yardımcı görevler gerçekleştirebilir. Çoğu metin tabanlı iş yükü — PDF’ler ve elektronik tablolar gibi dosyaları analiz etmeyi düşünün — onun yetki alanına girer; Llama modellerinin hiçbiri görüntüleri işleyemez veya üretemez, ancak bu değiştirmek Yakın gelecekte.

Tüm son Llama modelleri, görevleri tamamlamak için üçüncü taraf uygulamaları, araçları ve API’leri kullanacak şekilde yapılandırılabilir. Son olaylarla ilgili soruları yanıtlamak için Brave Search’ü, matematik ve bilimle ilgili sorgular için Wolfram Alpha API’sini ve kodu doğrulamak için bir Python yorumlayıcısını kullanmak üzere kutudan çıktıkları anda eğitilirler. Ayrıca Meta, Llama 3.1 modellerinin daha önce görmedikleri belirli araçları kullanabildiğini söylüyor (ancak güvenilir bir şekilde (Bu araçları kullanmak ayrı bir konudur).

Llama’yı nerelerde kullanabilirim?

Eğer sadece Llama ile sohbet etmek istiyorsanız, bu Meta AI sohbet robotu deneyimini güçlendiriyor Facebook Messenger, WhatsApp, Instagram, Oculus ve Meta.ai’da.

Llama ile inşa eden geliştiriciler, modeli çoğu popüler bulut platformunda indirebilir, kullanabilir veya ince ayar yapabilir. Meta, Nvidia, Databricks, Groq, Dell ve Snowflake dahil olmak üzere Llama’yı barındıran 25’ten fazla ortağı olduğunu iddia ediyor.

Bu ortaklardan bazıları, modellerin özel verilere başvurmasını ve daha düşük gecikmelerde çalışmasını sağlayan araçlar da dahil olmak üzere Llama’nın üzerine ek araçlar ve hizmetler oluşturdu.

Meta, sohbet robotlarını güçlendirmek ve kod üretmek gibi genel amaçlı uygulamalar için daha küçük modelleri Llama 8B ve Llama 70B’yi kullanmayı öneriyor. Şirket, Llama 405B’nin model damıtımı (bilgiyi büyük bir modelden daha küçük, daha verimli bir modele aktarma süreci) ve alternatif modelleri eğitmek (veya ince ayar yapmak) için sentetik veri üretmek için daha iyi saklandığını söylüyor.

Önemli olan, Llama lisansı geliştiricilerin modeli nasıl dağıtabileceklerini kısıtlar:Aylık 700 milyondan fazla kullanıcısı olan uygulama geliştiricileri, Meta’nın kendi takdirine bağlı olarak vereceği özel bir lisansı Meta’dan talep etmelidir.

Meta, Llama’nın yanı sıra modeli kullanmayı “daha güvenli” hale getirmeyi amaçlayan araçlar da sağlar:

  • Lama Muhafızı, bir moderasyon çerçevesi
  • Hızlı Muhafız, hızlı enjeksiyon saldırılarına karşı koruma sağlayan bir araç
  • Siber Güvenlik Değerlendirmesi, siber güvenlik risk değerlendirme paketi

Llama Guard, suç faaliyeti, çocuk istismarı, telif hakkı ihlalleri, nefret, kendine zarar verme ve cinsel tacizle ilgili içerikler de dahil olmak üzere bir Llama modeline beslenen veya bu model tarafından oluşturulan potansiyel olarak sorunlu içeriği tespit etmeye çalışır. Geliştiriciler özelleştirmek Engellenen içerik kategorilerini belirleyin ve engellemeleri Llama’nın desteklediği tüm dillere uygulayın.

Llama Guard gibi Prompt Guard da Llama için tasarlanmış metni engelleyebilir, ancak yalnızca modele “saldırmak” ve istenmeyen şekillerde davranmasını sağlamak için tasarlanmış metni engelleyebilir. Meta, Llama Guard’ın “” içeren istemlere ek olarak açıkça kötü amaçlı istemlere (yani Llama’nın yerleşik güvenlik filtrelerini aşmaya çalışan jailbreak’ler) karşı savunma sağlayabileceğini iddia ediyor.enjekte edilen girdiler.”

CyberSecEval’e gelince, bu bir araçtan çok model güvenliğini ölçmek için bir dizi kıyaslamadır. CyberSecEval, bir Llama modelinin uygulama geliştiricileri ve son kullanıcılar için oluşturduğu riski (en azından Meta’nın kriterlerine göre) “otomatik sosyal mühendislik” ve “saldırgan siber operasyonları ölçeklendirme” gibi alanlarda değerlendirebilir.

Lama’nın sınırlamaları

Lama, tüm üretken yapay zeka modelleri gibi bazı riskler ve sınırlamalarla birlikte gelir.

Örneğin, Meta’nın Llama’yı telif hakkıyla korunan içerik konusunda eğitip eğitmediği belirsizdir. Eğer eğittiyse, kullanıcılar istemeden modelin tekrarladığı telif hakkıyla korunan bir parçacığı kullanırlarsa ihlalden sorumlu tutulabilirler.

Meta bir noktada AI eğitimi için telif hakkıyla korunan e-kitaplar kullanıldı Reuters’ın son haberine göre, kendi avukatlarının uyarılarına rağmen. Şirket, tartışmalı bir şekilde yapay zekasını Instagram ve Facebook gönderileri, fotoğrafları ve başlıkları üzerinde eğitiyor ve kullanıcıların vazgeçmesini zorlaştırırDahası, Meta, OpenAI ile birlikte, komedyen Sarah Silverman’ın da aralarında bulunduğu yazarlar tarafından, şirketlerin model eğitimi için telif hakkıyla korunan verileri izinsiz kullandığı iddiasıyla açılan devam eden bir davanın konusu.

Programlama, Llama kullanırken dikkatli olmanız gereken bir diğer alandır. Bunun nedeni, Llama’nın — üretken AI muadilleri gibi — hatalı veya güvenli olmayan kod üretmek.

Her zaman olduğu gibi, yapay zeka tarafından üretilen herhangi bir kodu bir hizmete veya yazılıma dahil etmeden önce bir insan uzmanın incelemesi en iyisidir.



genel-24