Büyük dil modellerinin popülaritesine rağmen, şirketler enerji tüketimini ve bilgi işlem maliyetlerini azaltmak için giderek daha fazla kompakt çözümlere yöneliyor. Bu eğilime yanıt olarak Google, “kıdemli” Gemini 2.0 modellerinin performansını koruyan, ancak temel GPU’lu akıllı telefonlar, dizüstü bilgisayarlar ve sunucular üzerinde çalışmak için optimize edilen küçük dil modeli Gemma 3’ün üçüncü sürümünü yayınladı.
Yeni model dört versiyonda mevcuttur: 1B, 4B, 12B ve 27B parametreleri. Ana iyileştirme, bağlam penceresinde Gemma 2’de 80 bine karşı 128 bin jeton artışıdır. Bu, daha hacimli istekler ve karmaşık senaryolar işlemenizi sağlar. Gemma 3, metin, görüntü ve kısa videoların multimodal analizini, çağrı işlevleri yoluyla görevlerin otomasyonunu destekler ve ayrıca 140 dil ile çalışır.
Hesaplama maliyetlerini daha da azaltmak için Google, modelin kuantum sürümlerini tanıttı. Nöral ağın ölçeklerindeki sayısal değerlerin doğruluğunu azaltma veya azaltma, doğruluk kaybı olmadan bir “sıkıştırma” görevi görür. Bu, yerel uygulamalar için kritik olan bir GPU veya TPU’da bile Gemma 3’ü başlatmanızı sağlar.
Şirkete göre Gemma 3, LLAMA-405B, Deepseek-V3 ve O3-mini gibi LLM’nin önünde “sınıfı için gelişmiş performans” gösteriyor. Chatbot Arena ELO’da, 27B sürüm Deepseek-R1’den sonra ikinci sırada yer aldı ve Mistral büyük ve Claude 3.7 sonnetini atladı.
Geliştiriciler, Gemma 3’ü Huging Face Transformers, Ollama, Pytorch, Jax ve Keras gibi araçlarla ve Google AI Studio, Huging Face veya Kaggle gibi araçlarla entegre edebilirler. Kurumsal müşteriler için AI Studio API üzerinden API modeli talebi mevcuttur.
Güvenlik, güncellemenin temel odağı haline geldi. Gemma 3, içerik üretimini şiddet, cinsel sahneler ve diğer bozukluklarla engelleyen yerleşik bir Shieldgemma 2-A 4B-parametreli görüntü filtresine sahiptir. Sistem, kullanıcı ihtiyaçlarına özelleştirmeye izin verir. Google’da belirtildiği gibi, modeli eğitirken katı veri işleme kuralları, güvenlik politikacılarına uygun olarak ince yapılandırma ve tehlikeli maddelerin oluşturulmasında potansiyel kötüye kullanımın değerlendirilmesi de dahil olmak üzere risklere uygun olarak ince yapılandırma kullanmıştır.
Şubat 2024’te ilk Gemma’nın çıkışından sonra küçük modellere ilgi keskin bir şekilde büyüdü. Microsoft Phi-4 ve Mistral Small 3 gibi kararlar, LLM’nin aşırı kapasiteleri olmadan dar problemleri çözebilecek AI talebini doğrulamaktadır. Aynı zamanda, Gemma İkizler’in damıtılmış bir versiyonu değildir – aynı veri seti ve mimarisinde değil, büyük bir modelden doğrudan bilginin “mirası” olmadan çalıştı.
Şirketler, belirli senaryolar için LLM’nin SLM veya damıtılmış sürümlerini giderek daha fazla seçiyor. Örneğin, basit bir kod düzenleyicisi için Claude 3.7 sonnet gibi güçlü bir model dağıtmak yerine, önemli kaynaklar gerektirmeyen ve yeniden eğitim risklerini azaltan kompakt bir analog kullanmak daha etkilidir. Gemma 3’ün piyasaya sürülmesiyle Google, bu segmentteki konumu güçlendirerek performans, maliyet ve güvenlik arasında bir denge sağlıyor.


