ChatGPT neşeli bir şekilde ilerlerken, birkaç büyük grup OpenAI’nin sohbet robotunun yükselişiyle rekabet etmeye çalışıyor. Bu, 24 Şubat 2022’de LLaMA adlı bir dil modelinin oluşturulduğunu duyuran Meta’nın yapay zeka şubesinin durumudur.

Öncelikle araştırmaya ayrılacak üretken bir yapay zeka

İçinde Bir deyim, Meta AI yeni temel dil modelini tanıttı. OpenAI’nin GPT-3’ü 175 milyar parametreye sahip, Google’ın LaMDA’sı en gelişmiş model için 137 milyar listeliyor, ancak Meta yalnızca 65 milyar parametreye güvenmeyi seçti. ” LLaMA gibi daha küçük, daha yetenekli modeller, büyük miktarda altyapıya erişimi olmayan araştırma topluluğunun diğer üyelerinin bu modelleri incelemesine izin vererek, bu önemli alanda erişimi daha da demokratikleştirir ve hızla değişir. şirketi haklı çıkarıyor.

aynı kategoride

NVIDIA, yapay zeka çılgınlığından yararlanıyor

LLaMA, en azından şimdilik sadece bilim insanlarına açık olacak. Amacı, araştırmacıların yapay zeka ile ilgili çalışmalarında ilerlemelerine yardımcı olmak olacaktır. Meta AI tarafından izlenen yol, GPT-3’ün geliştirilmiş bir sürümünü temel alan OpenAI’nin sohbet robotu ChatGPT ile izlediği yoldan farklıdır. Microsoft ile ortaklık kuran OpenAI, aracının genel halk tarafından kullanılmasını sağlamak istiyor.

Satya Nadella’nın firması, üretken yapay zekayı Bing’e dahil etmek için birkaç hafta çalıştı. Microsoft, arama motorunu güçlendirdiğini açıkladıktan sonra kaymaları önlemek için yapay zekasını dizginlemek zorunda kaldı. Söz konusu yapay zeka, konuşmalar uzadığında garip bir şekilde davranacak ve artık ilk konuyla hiçbir ilgisi olmayan cevaplar sunacaktı. Teknoloji devi artık aracının kullanımını günlük 60 sohbet oturumu ve oturum başına 6 soru ile sınırlıyor.

Aynı şekilde Google da alarm verdi ve tüm ekiplerini ChatGPT’ye benzer ve LaMDA tabanlı bir araç üzerinde çalışmaya çağırdı. Bu, şu anda kullanılamayan yeni sohbet robotu Apprentice Bard’ın duyurulmasına yol açtı. Google araştırmacıları, AI’larında ince ayar yapmak için zaman ayırmak istiyor. Konuşan robotlarının deneme versiyonunun sunumu sırasında, James Webb Uzay Teleskobu ile ilgili bir soruya yanlış bir cevap verdi.

Meta AI, dil modelinin hala geliştirilebileceğinin farkında

LLaMA’ya gelince, birçok dil modeli gibi çalışır. Girdi olarak bir kelime dizisini alır ve ilerledikçe metin oluşturmak için bir sonraki kelimeyi tahmin etmeye çalışır. Meta IA, aracını eğitmek için 20 farklı dilden metinler kullandı. Bu diller Latin ve Kiril alfabeleri ile en çok kullanılan 20 dildir.

Dil modelinin arkasındaki araştırmacılar memnun, ancak araçlarının bir noktada önyargıları olduğunu veya olacağını biliyorlar ” Büyük dil modellerinde önyargı, toksik geri bildirim ve halüsinasyon risklerini ele almak için hala yapılacak araştırmalar var. Diğer modeller gibi, LLaMA da bu zorlukları paylaşıyor “. Bu zorluğun üstesinden gelmek için Meta, bu algoritmik önyargıları sınırlayan veya ortadan kaldıran yeni yaklaşımları kolayca test edebilmeleri için LLaMA kodunu diğer bilim insanlarıyla paylaşacak.

Aynı zamanda, Meta AI başka bir zorlukla karşı karşıyadır: dil modelindeki son gelişmeler güçlü araçların oluşturulmasına izin veriyorsa, bunların eğitimi veya yürütülmesi için gerekli kaynakların eksikliği, gelişimlerinin önünde bir engeldir. 65 milyar parametreli temel modele kıyasla daha az kaynak kullanan LLaMA’nın birkaç alt versiyonu geliştirilecektir. Belirli bir temayla ilgili veya yalnızca bir veya iki dilden yararlanan belirli durumlarda kullanılabilirler.



genel-16