Mistral, Çarşamba günü amiral gemisi açık kaynaklı yapay zeka (AI) modeli Mistral Large 2’nin yeni neslini yayınladı. Şirket, AI modelinin kod oluşturma, matematik ve muhakemede önemli ölçüde geliştirilmiş yetenekler sunduğunu iddia ediyor. Ayrıca, birkaç yeni dil için destek ve gelişmiş işlev çağırma yetenekleri de alıyor. Ayrıca, yakın zamanda yayınlanan Meta Llama 3.1 405B AI modelinin üçte biri boyutunda olmasına rağmen Mistral’in amiral gemisi büyük dil modelinin (LLM) benzer performans sunduğu söyleniyor. Özellikle, Mistral Large 2 yalnızca araştırma ve ticari olmayan kullanımlar için mevcuttur.

Mistral Büyük 2 Özellikleri

Şirket, AI modelini bir haber merkezinde duyurdu postalamakMistral Large 2, Meta’nın en son AI sunumuna benzer olan 1.28.000 token bağlam penceresiyle birlikte gelir. Ek olarak, amiral gemisi Mistral AI modeli Arapça, Çince, Fransızca, Almanca, Hintçe, İtalyanca, Japonca, Korece, Portekizce, Rusça ve İspanyolca dahil olmak üzere birkaç yeni dili destekler. Bunun yanı sıra, 80’den fazla kodlama dilinde kod da üretebilir.

Mistral’in yeni AI modeli 123 milyar parametrelik bir boyuta sahip ve tek bir düğümde çalışabiliyor. Şirket, Large 2 modelini geliştirmek için üç ana odak alanı olduğunu söyledi. Birincisi kod üretimiydi ve LLM büyük miktarda kodlama verisi üzerinde eğitildi. İkincisi, akıl yürütme yeteneğini geliştirmek ve halüsinasyon örneklerini en aza indirmek için AI firması, yanıtlarında daha dikkatli olması için modeli ince ayarladı. Son olarak, AI modeli “çözüm bulamadığında veya güvenilir bir yanıt sağlamak için yeterli bilgiye sahip olmadığında bunu kabul etmek” üzere eğitildi.

Llama 3.1 405B’nin üçte biri büyüklüğünde olmasına rağmen şirket, LLM’sinin kendisinden daha iyi performans gösterdiğini iddia ediyor. Mistral, dahili kıyaslama testlerine dayanarak AI modelinin kod oluşturma ve matematik performansında daha iyi performans gösterdiğini söyledi. Ayrıca Java kod oluşturmada GPT-4o’dan daha iyi performans gösterdiğini iddia etti.

Ayrıca şirket, Mistral Large 2’nin karmaşık iş uygulamalarına güç vermesine olanak tanıyan gelişmiş işlev çağırma ve alma becerilerine sahip olduğunu iddia ediyor. İşlev çağırma, AI modellerinin harici araçlar veya işlevlerle etkileşim kurma yeteneğidir. Bu, çeşitli kaynaklardan veri elde etmelerine ve daha doğru, bilgilendirici ve verimli yanıtlar sağlamalarına olanak tanır.

Şirket, Large 2 AI modelini yönetilen bir uygulama programlama arayüzü (API) aracılığıyla Vertex AI’ya getirmek için Google Cloud Platform ile ortaklık kurdu. Ayrıca Azure AI Studio, Amazon Bedrock ve IBM Watsonx aracılığıyla bulutta da mevcuttur. Açık kaynaklı bir AI modeli olduğundan, ilgilenen kişiler LLM’ye mistral-large-2407 adı altında web sitesi üzerinden de erişebilirler.

Talimat modelini indirmek için kullanıcılar HuggingFace’ini kontrol edebilirler listelemeÖzellikle, yalnızca araştırma ve ticari olmayan amaçlar için kullanım ve değişikliğe izin veren Mistral Araştırma Lisansı altında mevcuttur.



genel-8