CroissantLLM, “egemen, açık, etik ve tutumlu” model

Son güncelleme: 5 Mart 2024 11:57

Contents

Akademik/endüstri ortaklığından doğan bir model
Algoritmaların kullanılan model ve veri kümelerine açılması

Hugging Face’te yapay zeka modeli sıkıntısı yok. Şimdi bir tane daha var. Bu, CentraleSupélec’teki MICS laboratuvarının araştırma ekipleri ve Illuin Technology dahil üreticiler tarafından tasarlanan bir dil modeli olan CroissantLLM’dir.

Geçen ay Fransız tek boynuzlu atı Mistral AI, en yeni üretken yapay zeka modeli Large’ı tanıttı. Ve bu duyuru dijital ekosistemde bazı eleştirilere yol açtı. Sebebi ise önceki modellerden farklı olarak Large’ın açık olmaması.

Akademik/endüstri ortaklığından doğan bir model

Ayrıca Large’ın lansmanı için Mistral AI, Microsoft ve Azure bulutu ile ortaklık kurdu. CroissantLLM bu nedenle açıklık ve aynı zamanda işbirliği açısından öne çıkıyor. LLM “akademi ve endüstri arasındaki yakın işbirliğinin sonucudur.”

Çeşitli akademik ortaklar (Sorbonne Üniversitesi, INESC-ID, Instituto Superior Técnico, Carnegie Mellon Üniversitesi ve Institut DATAIA) ilişkilidir. Modelin tasarımına endüstriyel oyuncular da katkıda bulundu.

Bunlar arasında Illuin Technology, Unbabel, Diabolocom ve EqualAI, MICS laboratuvarının yöneticisi Céline Hudelot’u gösteriyor. Akademik/endüstriyel işbirliği CroissantLLM’nin özelliklerinden birini oluşturur, ancak tek özelliği değildir.

Tasarımcıları bu nedenle egemen, açık, etik ve tutumlu bir dil modeli talep ediyor ve bu model, Le Digital Lab de CentraleSupélec ve Illuin Technology tarafından ortaklaşa düzenlenen Yapay Zeka Atölyeleri kapsamında 7 Mart’ta Paris La Défense’de sunulacak.

Algoritmaların kullanılan model ve veri kümelerine açılması

Bu özellikler sayesinde geliştiriciler LLM’nin şirketlerin ihtiyaçlarına ve iş süreçlerine uyarlandığını düşünüyor. “Fransız kültürüne” ait olan ancak aynı zamanda İngilizce içerikle de eğitildiği için iki dilli olan yapay zeka modeli, Jean Zay süper bilgisayarının bilgi işlem gücü aracılığıyla eğitildi.

Tasarımcıları, “Veri kümeleri aynı zamanda Fransız ve halka açık, dolayısıyla biliniyor ve izlenebilir” diyor. Ayrıca açıklık toplamdır ve dolayısıyla “algoritmalardan kullanılan modellere ve veri kümelerine kadar” kapsar.

Etik düzeyde, “araştırma ekibi, son Yapay Zeka Yasasının belirlediği kurallara uyumu sağladı”. Son olarak, tutumluluk konusunda – “hızdan taviz vermeden” – LLM’nin 1.3B parametresi vardır.

Araştırmacılar, “Dolayısıyla çalıştırmak için önemli bir bilgi işlem gücüne ihtiyaç duymuyor, bu da yalnızca birkaç GPU gerektirmekle kalmayıp akıllı telefonlarda ve kişisel bilgisayarlarda da çalışmasına olanak tanıyor” diye vurguluyor.

Düşük enerji tüketimine sahip CroissantLLM, yaratıcılarının belirttiği kriterlere göre “boyutuna göre en verimli Fransızca konuşulan modeldir”. Artık 500.000’e yakın modele ev sahipliği yapan Hugging Face’te yerini bulmaya devam ediyor.

genel-15

ETİKETLENDİ:Açık CroissantLLM egemen etik Model tutumlu

Bu Makaleyi Paylaş

Önceki Makale Deel, Afrika’nın PaySpace’ini satın aldı ve ARR’de 500 milyon doları aştığını söyledi

Sonraki Makale Xiaomi 15 Serisi Ekran İçi Ultrasonik Parmak İzi Sensörüne Sahip Olabilir: Rapor

CroissantLLM, “egemen, açık, etik ve tutumlu” model

Akademik/endüstri ortaklığından doğan bir model

Algoritmaların kullanılan model ve veri kümelerine açılması

Sanal Medya

Son Eklenenler

AI token maliyetleri büyük bir sorun haline geliyor, OpenAI çözümler arıyor

Elden Ring: Tarnished Edition Switch 2 İçin Ön Sipariş Fırsatları

LinkedIn üzerinden Batılıları tuzağa düşüren Çin casusları

AMD Helios MI455X AI platformu lanse edildi, Ethernet sınırlamaları var

Kurucular Fonu, Sam Altman ve Palmer Luckey’in Yer Aldığı Heyecan Verici Oyun Şovunu Başlattı

Laravel Başlangıç Kiti Neden Geliştirdim

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer