Sınır AI modelleri için, yağmur yağdığında sağanak yağar. Mistral Çarşamba günü, kod üretimi, matematik ve muhakeme açısından OpenAI ve Meta’nın en son keskin uçlu modelleriyle aynı seviyede olduğunu iddia ettiği yeni bir amiral gemisi modeli olan Large 2’yi yayınladı.
The Mistral Large 2’nin piyasaya sürülmesi Meta’nın en son ve en iyi açık kaynaklı modeli Llama 3.1 405b’yi piyasaya sürmesinden sadece bir gün sonra düştü. Mistral, Large 2’nin açık modeller için performans ve maliyet çıtasını yükselttiğini ve bunu bir avuç kıyaslama ile desteklediğini söylüyor.
Large 2, kod üretimi ve matematik performansı açısından Llama 3.1 405B’yi geride bırakıyor gibi görünüyor ve bunu parametrelerin üçte birinden daha azıyla, yani tam olarak 123 milyarla yapıyor.
Mistral, bir basın bülteninde eğitim sırasında odaklandığı temel alanlardan birinin modelin halüsinasyon sorunlarını en aza indirmek olduğunu söylüyor. Şirket, Large 2’nin yanıtlarında daha seçici olması için eğitildiğini, makul görünen bir şey uydurmak yerine bir şeyi bilmediğinde bunu kabul ettiğini söylüyor.
Paris merkezli AI girişimi, General Catalyst liderliğinde 6 milyar dolarlık bir değerlemeyle Seri B finansman turunda yakın zamanda 640 milyon dolar topladı. Mistral, yapay zeka alanına yeni girenlerden biri olmasına rağmen, hızla en son teknolojiye yakın veya en son teknolojiye yakın AI modelleri sunuyor.
Ancak, Mistral’in modellerinin, diğerlerinin çoğu gibi, geleneksel anlamda açık kaynaklı olmadığını belirtmek önemlidir – modelin herhangi bir ticari uygulaması ücretli bir lisans gerektirir. Ve örneğin GPT-40’dan daha açık olsa da, dünyada çok azı bu kadar büyük bir modeli uygulamak için uzmanlığa ve altyapıya sahiptir. (Bu, Llama’nın 405 milyar parametresi için iki katına çıkar, elbette.)
Mistral Large 2’de eksik olan ve dün Meta’nın Llama 3.1 sürümünde de bulunmayan bir şey, çok modlu yeteneklerdir. OpenAI, çok modlu AI sistemleri açısından rekabette çok öndedir, görüntü ve metni aynı anda işleyebilir, bazı girişimlerin giderek daha fazla geliştirmek istediği bir özelliktir.
Modelin 128.000 token penceresi var, bu da Large 2’nin tek bir komutta çok fazla veri alabileceği anlamına geliyor (128.000 token yaklaşık 300 sayfalık bir kitaba eşittir). Mistral’in yeni modeli ayrıca geliştirilmiş çok dilli desteği de içeriyor. Large 2, 80 kodlama dilinin yanı sıra İngilizce, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Arapça, Hintçe, Rusça, Çince, Japonca ve Korece’yi anlıyor. Özellikle Mistral, Large 2’nin gevezelik etme eğiliminde olan önde gelen AI modellerinden daha özlü yanıtlar ürettiğini iddia ediyor.
Mistral Large 2, Google Vertex AI, Amazon Bedrock, Azure AI Studio ve IBM watsonx.ai’da kullanılabilir. Ayrıca yeni modeli Mistral’in le Plateforme’unda “mistral-large-2407” adı altında kullanabilir ve girişimin ChatGPT rakibi le Chat’te ücretsiz olarak deneyebilirsiniz.