Fransız AI girişimi Mistral metinlerin yanı sıra resim de işleyebilen ilk modelini piyasaya sürdü.
Pixtral 12B olarak adlandırılan 12 milyar parametreli modelin boyutu yaklaşık 24 GB’tır. Parametreler kabaca bir modelin problem çözme becerilerine karşılık gelir ve daha fazla parametreye sahip modeller genellikle daha az parametreye sahip olanlardan daha iyi performans gösterir.
Mistral’in metin modellerinden biri olan Nemo 12B üzerine inşa edilen yeni model, resim URL’leri veya ikili-metin kodlama şeması base64 kullanılarak kodlanmış resimler verildiğinde, keyfi bir boyuttaki keyfi sayıda resimle ilgili soruları yanıtlayabilir. Anthropic’in Claude ailesi ve OpenAI’nin GPT-4o gibi diğer çok modlu modellere benzer şekilde, Pixtral 12B — en azından teoride — resimlere başlık ekleme ve bir fotoğraftaki nesne sayısını sayma gibi görevleri gerçekleştirebilmelidir.
Torrent bağlantısıyla şu adresten erişilebilir: GitHub Ve Sarılma YüzüYapay zeka ve makine öğrenimi geliştirme platformu Pixtral 12B, muhtemelen Mistral’in standart geliştirme lisansı altında indirilebilir, ince ayar yapılabilir ve kullanılabilir. Bu lisans, ticari uygulamalar için ücretli lisans gerektirirken, araştırma ve akademik kullanımlar için zorunlu değildir.
Ancak Mistral, Pixtral 12B için hangi lisansın geçerli olduğunu henüz açıklamadı. Başlangıç, Apache 2.0 lisansı altında kısıtlama olmaksızın bazı modelleri (hepsini değil) sunuyor. Daha fazla bilgi için Mistral’in PR’ına ulaştık ve geri dönüş alırsak bu gönderiyi güncelleyeceğiz.
Bu yazar ne yazık ki Pixtral 12B’yi bir turlayamadı — yayın sırasında çalışan web demoları yoktu. X’teki bir gönderide, Mistral geliştirici ilişkileri başkanı Sophia Yang, söz konusu Pixtral 12B, yakında Mistral’in chatbot ve API sunucu platformları Le Chat ve Le Platforme’de test edilmeye hazır olacak.
Mistral’in Pixtral 12B’yi geliştirmek için hangi görüntü verilerini kullandığı belirsiz.
En üretken AI modelleri, Mistral’in diğer modelleri de dahilgenellikle telif hakkıyla korunan, web’deki geniş miktardaki kamusal veriler üzerinde eğitilirler. Bazı model satıcıları, “adil kullanım” haklarının kendilerine veri toplama hakkı verdiğini savunurlar. herhangi kamuya açık verilerdir, ancak birçok telif hakkı sahibi buna katılmamaktadır ve bu uygulamayı durdurmak için OpenAI ve Midjourney gibi daha büyük satıcılara dava açmıştır.
Pixtral 12B, Mistral’in General Catalyst liderliğinde 645 milyon dolarlık bir finansman turunu kapatmasının ardından geldi ve şirkete 6 milyar dolar değer biçildi. Bir yıldan biraz fazla bir süre önce kurulan ve Microsoft’un azınlık hissesine sahip olduğu Mistral, AI topluluğundaki birçok kişi tarafından Avrupa’nın OpenAI’ya cevabı olarak görülüyor. Genç şirketin şu ana kadarki stratejisi, ücretsiz “açık” modeller yayınlamak, bu modellerin yönetilen sürümleri için ücretlendirme yapmak ve kurumsal müşterilere danışmanlık hizmetleri sağlamaktı.