Google, 21 Şubat Çarşamba günü Gemma adında yeni, hafif, açık kaynaklı bir yapay zeka (AI) modelleri ailesini piyasaya sürdü. Gemma’nın iki çeşidi, Gemma 2B ve Gemma 7B, geliştiricilerin ve araştırmacıların kullanımına sunuldu. Teknoloji devi, Gemini yapay zeka modellerini oluşturmak için kullandığı teknoloji ve araştırmayı Gemma için de kullandığını söyledi. İlginç bir şekilde Gemini 1.5 modeli geçen hafta görücüye çıktı. Bu daha küçük dil modelleri, göreve özel yapay zeka araçları oluşturmak için kullanılabilir ve şirket, sorumlu ticari kullanıma ve dağıtıma izin verir.
Duyuru Google CEO’su Sundar Pichai tarafından yapıldı. postalamak X’te (eski adıyla Twitter). Şöyle söyledi: “Dil anlama ve muhakeme açısından karşılaştırmalı değerlendirmelerde güçlü bir performans sergileyen Gemma, bugünden itibaren dünya çapında iki boyutta (2B ve 7B) mevcuttur, çok çeşitli araçları ve sistemleri destekler ve bir geliştirici dizüstü bilgisayarında, iş istasyonunda veya @GoogleCloud’da çalışır. .” Şirket ayrıca yaratıldı İnsanların Kaggle Modelleri sayfasında hızlı başlangıç bağlantılarını ve kod örneklerini bulabilecekleri, AI araçlarını Vertex AI (geliştiricilerin AI/ML araçları oluşturmaları için Google’ın platformu) aracılığıyla hızlı bir şekilde dağıtabilecekleri veya AI modeli için geliştirici odaklı bir açılış sayfası modeli seçin ve onu Collab kullanarak ayrı bir alana ekleyin (Keras 3.0 gerektirir).
Gemma AI modellerinin bazı özelliklerine dikkat çeken Google, her iki varyantın da önceden eğitildiğini ve talimatlara göre ayarlandığını söyledi. Hugging Face, MaxText, NVIDIA NeMo ve TensorRT-LLM gibi popüler veri havuzlarıyla entegredir. Dil modelleri dizüstü bilgisayarlarda, iş istasyonlarında veya Vertex AI ve Google Kubernetes Engine (GKE) aracılığıyla Google Cloud’larda çalıştırılabilir. Teknoloji devi ayrıca geliştiricilerin güvenli ve sorumlu yapay zeka araçları oluşturmasına yardımcı olmak için yeni bir Sorumlu Üretken Yapay Zeka Araç Seti’ni de yayınladı.
Google tarafından paylaşılan raporlara göre Gemma, Massive Multitask Language Understanding (MMLU), HumanEval, HellaSwag ve BIG-Bench Hard (BBH) gibi birçok önemli kıyaslamada Meta’nın Llama-2 dil modelinden daha iyi performans gösterdi. Çeşitli raporlara göre Meta, halihazırda Llama-3 üzerinde çalışmaya başladı.
Geliştiriciler ve araştırmacılar için açık kaynaklı daha küçük dil modellerinin piyasaya sürülmesi, yapay zeka alanında trend haline gelen bir şey. Stabilite, Meta, MosaicML ve hatta Flan-T5 modelleriyle Google zaten açık kaynak olarak mevcuttur. Bir yandan, yapay zeka firmalarıyla çalışmayan tüm geliştiricilerin ve veri bilimcilerinin teknolojide ellerini deneyip benzersiz araçlar yaratabilmeleri nedeniyle bir ekosistem oluşturulmasına yardımcı olur. Öte yandan, çoğu zaman firmaların kendileri abonelik ücretiyle birlikte gelen dağıtım platformları sunduğundan bu durum şirkete de fayda sağlar. Ayrıca geliştiriciler tarafından benimsenmesi, genellikle eğitim verilerindeki veya piyasaya sürülmeden önce tespit edilemeyen algoritmadaki kusurları vurgulayarak kuruluşların modellerini geliştirmesine olanak tanır.