Mistral, Çarşamba günü Pixtral 12B adlı ilk çok modlu yapay zeka (AI) modelini yayınladı. Açık kaynaklı büyük dil modelleri (LLM’ler) ile bilinen AI firması, en son AI modelini kullanıcıların indirip test edebilmesi için GitHub ve Hugging Face’te de kullanıma sundu. Özellikle, çok modlu olmasına rağmen Pixtral, yalnızca bilgisayarlı görüş teknolojisini kullanarak görüntüleri işleyebilir ve bunlar hakkında soruları yanıtlayabilir. Bu işlevsellik için iki özel kodlayıcı eklendi. Stable Diffusion modelleri veya Midjourney’nin Generative Adversarial Networks (GAN’lar) gibi görüntüler üretemez.

Mistral, Pixtral 12B’yi Piyasaya Sürüyor

Minimalist duyurularıyla ünlenen Mistral’in X’teki (eski adıyla Twitter) resmi hesabı, yapay zeka modelini yayınladı postalamak magnet bağlantısını paylaşarak. Pixtral 12B’nin toplam dosya boyutu 24 GB’tır ve modeli çalıştırmak için NPU etkinleştirilmiş bir PC veya güçlü bir GPU’ya sahip bir PC gerekecektir.

Pixtral 12B, 12 milyar parametreyle birlikte gelir ve şirketin mevcut Nemo 12B AI modeli kullanılarak üretilmiştir. Mistral, kullanıcıların ayrıca görüntü adaptörü olarak Gauss Hata Doğrusal Birimi’ne (GeLU) ve görüntü kodlayıcı olarak 2D Döner Pozisyon Gömme’ye (RoPE) ihtiyaç duyacağını vurgulamaktadır.

Özellikle, kullanıcılar Pixtral 12B’ye resim dosyaları veya URL’ler yükleyebilir ve nesneleri tanımlama, nesne sayısını sayma ve ek bilgi paylaşma gibi resimle ilgili soruları yanıtlayabilmelidir. Nemo üzerine inşa edildiğinden, model aynı zamanda tüm tipik metin tabanlı görevleri tamamlamada da usta olacaktır.

Bir Reddit kullanıcısı gönderildi Pixtral 12B’nin kıyaslama puanları hakkında bir görüntü ve LLM’nin ChartQA tezgahında çok modlu yeteneklerde Claude-3 Haiku ve Phi-3 Vision’ı geride bıraktığı görülüyor. Ayrıca, çok modlu bilgi ve muhakeme için Massive Multitask Language Understanding (MMLU) tezgahında her iki rakip AI modelini de geride bırakıyor.

Şirket sözcüsüne atıfta bulunan TechCrunch raporlar Mistral AI modelinin ince ayar yapılabileceği ve Apache 2.0 lisansı altında kullanılabileceği anlamına gelir. Bu, modelin çıktılarının kısıtlama olmaksızın kişisel veya ticari kullanım için kullanılabileceği anlamına gelir. Ek olarak, Mistral’daki Geliştirici İlişkileri Başkanı Sophia Yang, bir postalamak Pixtral 12B’nin yakında Le Chat ve Le Platforme’da satışa sunulacağı bildirildi.

Şimdilik kullanıcılar, şirket tarafından sağlanan mıknatıs bağlantısını kullanarak AI modelini doğrudan indirebilirler. Alternatif olarak, model ağırlıkları da barındırılan Hugging Face ve GitHub’da listelemeler.



genel-8