Mistral'in Large 2'si Meta ve OpenAI'nin son modellerine cevabıdır - Dünyadan Güncel Teknoloji Haberleri

Mistral’in Large 2’si Meta ve OpenAI’nin son modellerine cevabıdır

Sınır AI modelleri için, yağmur yağdığında sağanak yağar. Mistral Çarşamba günü, kod üretimi, matematik ve muhakeme açısından OpenAI ve Meta’nın en son keskin uçlu modelleriyle aynı seviyede olduğunu iddia ettiği yeni bir amiral gemisi modeli olan Large 2’yi yayınladı.

The Mistral Large 2’nin piyasaya sürülmesi Meta’nın en son ve en iyi açık kaynaklı modeli Llama 3.1 405b’yi piyasaya sürmesinden sadece bir gün sonra düştü. Mistral, Large 2’nin açık modeller için performans ve maliyet çıtasını yükselttiğini ve bunu bir avuç kıyaslama ile desteklediğini söylüyor.

Large 2, kod üretimi ve matematik performansı açısından Llama 3.1 405B’yi geride bırakıyor gibi görünüyor ve bunu parametrelerin üçte birinden daha azıyla, yani tam olarak 123 milyarla yapıyor.

Mistral, bir basın bülteninde eğitim sırasında odaklandığı temel alanlardan birinin modelin halüsinasyon sorunlarını en aza indirmek olduğunu söylüyor. Şirket, Large 2’nin yanıtlarında daha seçici olması için eğitildiğini, makul görünen bir şey uydurmak yerine bir şeyi bilmediğinde bunu kabul ettiğini söylüyor.

Paris merkezli AI girişimi, General Catalyst liderliğinde 6 milyar dolarlık bir değerlemeyle Seri B finansman turunda yakın zamanda 640 milyon dolar topladı. Mistral, yapay zeka alanına yeni girenlerden biri olmasına rağmen, hızla en son teknolojiye yakın veya en son teknolojiye yakın AI modelleri sunuyor.

Ancak, Mistral’in modellerinin, diğerlerinin çoğu gibi, geleneksel anlamda açık kaynaklı olmadığını belirtmek önemlidir – modelin herhangi bir ticari uygulaması ücretli bir lisans gerektirir. Ve örneğin GPT-40’dan daha açık olsa da, dünyada çok azı bu kadar büyük bir modeli uygulamak için uzmanlığa ve altyapıya sahiptir. (Bu, Llama’nın 405 milyar parametresi için iki katına çıkar, elbette.)

Mistral Large 2’de eksik olan ve dün Meta’nın Llama 3.1 sürümünde de bulunmayan bir şey, çok modlu yeteneklerdir. OpenAI, çok modlu AI sistemleri açısından rekabette çok öndedir, görüntü ve metni aynı anda işleyebilir, bazı girişimlerin giderek daha fazla geliştirmek istediği bir özelliktir.

Modelin 128.000 token penceresi var, bu da Large 2’nin tek bir komutta çok fazla veri alabileceği anlamına geliyor (128.000 token yaklaşık 300 sayfalık bir kitaba eşittir). Mistral’in yeni modeli ayrıca geliştirilmiş çok dilli desteği de içeriyor. Large 2, 80 kodlama dilinin yanı sıra İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Arapça, Hintçe, Rusça, Çince, Japonca ve Korece’yi anlıyor. Özellikle Mistral, Large 2’nin gevezelik etme eğiliminde olan önde gelen AI modellerinden daha özlü yanıtlar ürettiğini iddia ediyor.

Mistral Large 2, Google Vertex AI, Amazon Bedrock, Azure AI Studio ve IBM watsonx.ai’da kullanılabilir. Ayrıca yeni modeli Mistral’in le Plateforme’unda “mistral-large-2407” adı altında kullanabilir ve girişimin ChatGPT rakibi le Chat’te ücretsiz olarak deneyebilirsiniz.

genel-24

Mistral’in Large 2’si Meta ve OpenAI’nin son modellerine cevabıdır

Byteknomers

By teknomers

Benzer İçerikler

Mesajlaşma deneyimini bir üst seviyeye taşımak için Google Mesajlar’a üç değişiklik geliyor

Dropbox CEO’su 500 Kişiyi İşten Çıkarırken ‘Tüm Sorumluluğu Üstleniyor’

Bu 9 sorun meydana geldiğinde Windows 11’in yeniden yüklenmesi gerektiğini biliyorum

HAİKYU!! Çöp Kutusu Savaşı Yarın Crunchyroll’a Geliyor

Stalker 2’nin sınırlı sürüm paketleri “sürekli ilgiyi” karşılamak için bir kez daha yayınlanıyor

Destiny 2 Xur Konumu ve 1 Kasım’da Satılık Ürünler

Büyü birleştirici aksiyon roguelike Magicraft, 1.0 lansmanıyla Steam’de yükselişe geçiyor

Google Pixel’in “Şimdi Yürütülüyor” uygulaması çok ihtiyaç duyulan bir yenilemeyi alıyor olabilir

Apple, bazı iPhone 14 Plus birimlerindeki ciddi bir kusuru düzeltmek için ücretsiz kamera onarımı sunuyor

Benchmark sızıntısı, Tensor G5’in bir hayal kırıklığı olacağını ancak oyunlarda Snapdragon 8 Elite’i geride bırakabileceğini ortaya koyuyor

Bir indirim uzmanı olarak, çok geç olmadan bu erken Kara Cuma Galaxy Tab promosyonlarına göz atmanızı tavsiye ederim

Blue Origin, devasa New Glenn 1. etabını bir sonraki adımda sıcak ateşle fırlatmak için taşıyor

Uluslararası SWOT uydusu gezegeni kasıp kavuran Grönland tsunamisini tespit ediyor

Dünyanın kutupları ters döndüğünde böyle ses çıkıyor

Kara delik çalışması Kerr’in çözüm varsayımlarına meydan okuyor

İlginizi Çekebilir

Mesajlaşma deneyimini bir üst seviyeye taşımak için Google Mesajlar’a üç değişiklik geliyor

Uyumluluk Yolculuğuna mı Çıkıyorsunuz? Davetsiz Misafir Nasıl Yardımcı Olabilir?

Yeni elektron mikroskobu tekniği, pil malzemelerindeki uzay yükü katmanlarının gözlemlenmesine olanak sağlar

Dropbox CEO’su 500 Kişiyi İşten Çıkarırken ‘Tüm Sorumluluğu Üstleniyor’