Hugging Face’te yapay zeka modeli sıkıntısı yok. Şimdi bir tane daha var. Bu, CentraleSupélec’teki MICS laboratuvarının araştırma ekipleri ve Illuin Technology dahil üreticiler tarafından tasarlanan bir dil modeli olan CroissantLLM’dir.
Geçen ay Fransız tek boynuzlu atı Mistral AI, en yeni üretken yapay zeka modeli Large’ı tanıttı. Ve bu duyuru dijital ekosistemde bazı eleştirilere yol açtı. Sebebi ise önceki modellerden farklı olarak Large’ın açık olmaması.
Akademik/endüstri ortaklığından doğan bir model
Ayrıca Large’ın lansmanı için Mistral AI, Microsoft ve Azure bulutu ile ortaklık kurdu. CroissantLLM bu nedenle açıklık ve aynı zamanda işbirliği açısından öne çıkıyor. LLM “akademi ve endüstri arasındaki yakın işbirliğinin sonucudur.”
Çeşitli akademik ortaklar (Sorbonne Üniversitesi, INESC-ID, Instituto Superior Técnico, Carnegie Mellon Üniversitesi ve Institut DATAIA) ilişkilidir. Modelin tasarımına endüstriyel oyuncular da katkıda bulundu.
Bunlar arasında Illuin Technology, Unbabel, Diabolocom ve EqualAI, MICS laboratuvarının yöneticisi Céline Hudelot’u gösteriyor. Akademik/endüstriyel işbirliği CroissantLLM’nin özelliklerinden birini oluşturur, ancak tek özelliği değildir.
Tasarımcıları bu nedenle egemen, açık, etik ve tutumlu bir dil modeli talep ediyor ve bu model, Le Digital Lab de CentraleSupélec ve Illuin Technology tarafından ortaklaşa düzenlenen Yapay Zeka Atölyeleri kapsamında 7 Mart’ta Paris La Défense’de sunulacak.
Algoritmaların kullanılan model ve veri kümelerine açılması
Bu özellikler sayesinde geliştiriciler LLM’nin şirketlerin ihtiyaçlarına ve iş süreçlerine uyarlandığını düşünüyor. “Fransız kültürüne” ait olan ancak aynı zamanda İngilizce içerikle de eğitildiği için iki dilli olan yapay zeka modeli, Jean Zay süper bilgisayarının bilgi işlem gücü aracılığıyla eğitildi.
Tasarımcıları, “Veri kümeleri aynı zamanda Fransız ve halka açık, dolayısıyla biliniyor ve izlenebilir” diyor. Ayrıca açıklık toplamdır ve dolayısıyla “algoritmalardan kullanılan modellere ve veri kümelerine kadar” kapsar.
Etik düzeyde, “araştırma ekibi, son Yapay Zeka Yasasının belirlediği kurallara uyumu sağladı”. Son olarak, tutumluluk konusunda – “hızdan taviz vermeden” – LLM’nin 1.3B parametresi vardır.
Araştırmacılar, “Dolayısıyla çalıştırmak için önemli bir bilgi işlem gücüne ihtiyaç duymuyor, bu da yalnızca birkaç GPU gerektirmekle kalmayıp akıllı telefonlarda ve kişisel bilgisayarlarda da çalışmasına olanak tanıyor” diye vurguluyor.
Düşük enerji tüketimine sahip CroissantLLM, yaratıcılarının belirttiği kriterlere göre “boyutuna göre en verimli Fransızca konuşulan modeldir”. Artık 500.000’e yakın modele ev sahipliği yapan Hugging Face’te yerini bulmaya devam ediyor.