Gemma 2 2B yapay zeka (AI) modeli Perşembe günü Google DeepMind tarafından yayınlandı. Gemma 2 AI modelleri ailesinin en son üyesi oldu ve Gemma 2 27B ve 9B modellerine katıldı. Hafif boyutuna rağmen şirket, LMSYS Chatbot Arena kıyaslamasında GPT-3.5 modellerinden daha iyi performans gösterdiğini iddia ediyor. Bunun yanı sıra teknoloji devi, Gemma 2’nin giriş ve çıkışını filtrelemek için bir sınıflandırıcı model paketi olan ShieldGemma’yı ve AI modelinin nasıl çalıştığına dair içgörüler sunan bir araştırma aracı olan Gemma Scope’u da yayınladı.
Gemma 2 2B AI Modelinin Özellikleri
Bir blogda postalamak Google for Developers’da şirket, ailenin en küçük dil modeli haline gelen Gemma 2 2B’yi duyurdu. Cihaz üstü bir AI modeli olarak tanıtılan gönderi, küçük parametre boyutuna rağmen çıktının, daha büyük modellerden damıtıldığı için ağırlık sınıfından önemli ölçüde daha yüksek olduğunu vurguladı. Ancak teknoloji devi, eğitimi için hangi AI modellerinin kullanıldığını açıklamadı.
Google ayrıca Gemma 2 2B AI modelinin büyük model sistemleri organizasyonu (LMSYS) Chatbot Arena Elo puanında GPT-3.5 modellerinden daha iyi performans gösterdiğini iddia etti. AI modelinin 1126 puan aldığı söylenirken, Mixtral 8x7b Instruct v0.1 modelinin 1114 ve GPT-3.5’in 1106 puan aldığı söyleniyor.
AI modeli ayrıca çok çeşitli donanımlarda çalışacak şekilde optimize edildi. Uç cihazlar ve bulut tabanlı dağıtım için Vertex AI ve Google Kubernetes Engine (GKE) için ince ayar yapıldı. Ayrıca Nvidia TensorRT-LLM kütüphanesi için optimize edildi ve Nvidia NIM olarak kullanıma sunuldu. Ayrıca Gemma 2 2B, Keras, JAX, Hugging Face ve diğer büyük platformlarla da entegre olur.
Açık kaynaklı bir AI modeli olduğundan, açık ağırlıklar Google’ın Hugging Face’inden indirilebilir listelemeKaggle veya Vertex AI Model Garden. Ayrıca Google AI Studio’da da denenebilir.
Gemma 2’nin yanı sıra, AI modelinin hem girişinde hem de çıkışında zararlı içerikleri tespit edip kaldırabilen bir güvenlik sınıflandırıcı paketi olan ShieldGemma da yayınlandı. Google, sistemin nefret söylemi, taciz, cinsel içerik ve tehlikeli içeriklere odaklanacağını söyledi.
Son olarak, akademisyenler ve geliştiriciler için bir araştırma aracı olan Gemma Scope da piyasaya sürüldü. Sistem, karar alma sürecinin nasıl çalıştığını ve mimarinin nasıl işlediğini vurgulamak için model içindeki belirli parçaları belirlemek amacıyla seyrek oto kodlayıcılar (SAE’ler) kullanır.