Hindistan merkezli yapay zeka laboratuvarı Sarvam, yeni nesil büyük dil modellerini tanıttı. Şirket, daha küçük ve verimli açık kaynaklı yapay zeka modellerinin, ABD ve Çin’deki büyük rakiplerinin daha pahalı sistemlerinin pazar payından alabileceğini umuyor.
Yeni Dil Modelleri ve Özellikleri
Sarvam, Yeni Delhi’de düzenlenen Hindistan AI Etki Zirvesi’nde, 30 milyar ve 105 milyar parametreli yeni modeller, metinden konuşmaya, konuşmadan metne ve belgelere göz atma işlevi veren bir vizyon modelini tanıttı. Bu modeller, 2024’te piyasaya sürdükleri 2 milyar parametreli Sarvam 1 modeline göre önemli bir yükseltme sunuyor.
Yeni modeller, sadece toplam parametrelerinin bir kısmını devreye sokarak büyük ölçüde hesaplama maliyetlerini düşüren “uzman karışımı” mimarisi ile tasarlandı. 30 milyar parametreli model, 32,000 token’lık bir bağlam penceresine sahipken, 105 milyar parametreli model ise daha karmaşık, çok adımlı mantık görevleri için 128,000 token’lık bir pencere sunuyor.
Yerel Dilleri Destekleyen Uygulamalar
Sarvam, bu yeni yapay zeka modellerinin, gerçek zamanlı uygulamaları desteklemek üzere tasarlandığını ifade etti. Özellikle Hindistan dillerinde sesli asistanlar ve sohbet sistemlerinde kullanılması hedefleniyor. 30 milyar parametreli model, 16 trilyon token metinle ön eğitim aldı ve 105 milyar parametreli model, çok sayıda Hint dilini kapsayan trilyonlarca token ile eğitildi.
Modellerin eğitimi, Hindistan hükümetinin desteklediği IndiaAI Misyonu kapsamındaki bilgisayar kaynakları kullanılarak gerçekleştirildi. Yenilikçi yaklaşımları sayesinde Sarvam, kullanıcıların ihtiyaçlarına odaklanarak büyümeyi planlıyor. Şirket, gelecekte 30B ve 105B modellerini açık kaynak olarak sunmayı hedefliyor.
Sarvam aynı zamanda, kod odaklı modeller ve kurumsal araçlar geliştirmeyi planladığını açıkladı. 2023 yılında kurulan şirket, 50 milyon dolardan fazla yatırım aldı ve Lightspeed Venture Partners, Khosla Ventures ile Peak XV Partners gibi önemli yatırımcılarla çalışıyor.
Kaynak: https://techcrunch.com/2026/02/18/indian-ai-lab-sarvams-new-models-are-a-major-bet-on-the-viability-of-open-source-ai/


