Hedef pazarınızın 22 resmi dili varsa ve halkı 19.000’den fazla lehçe konuşuyorsa, birkaç dilde en iyi şekilde çalışabilen, yalnızca metin tabanlı bir yapay zeka sohbet robotu sunmak mantıklı mıdır?
İşte Hint AI girişiminin sorusu Sarvam çözmek için çalışıyor ve Salı günü, 10’dan fazla Hint dilini destekleyen sesle etkinleştirilen bir AI botu da dahil olmak üzere bir dizi teklif başlattı ve ülkedeki insanların metin üzerinden sohbet etmek yerine kendi dillerinde bir AI modeliyle konuşmayı tercih edeceğine bahse girdi. Girişim ayrıca küçük bir dil modeli, avukatlar için bir AI aracı ve bir sesli dil modeli de başlatıyor.
Sarvam AI’nın kurucu ortağı Vivek Raghavan, TechCrunch’a “İnsanlar kendi dillerinde konuşmayı tercih ediyor. Günümüzde Hint dillerinde yazmak son derece zor” dedi.
Öncelikle işletmeleri ve kuruluşları hedefleyen Bengaluru merkezli girişim, AI sesle etkinleştirilen botlarını birçok sektöre, özellikle de müşteri desteğine güvenenlere sunuyor. Örnek olarak, müşterilerinden birini gösterdi: Dini içerik sunan bir girişim olan Sri Mandir, ödemeleri kabul etmek için Sarvam’ın AI aracısını kullanıyor ve şu ana kadar 270.000’den fazla işlem gerçekleştirdi.
Şirket, yapay zeka ses aracılarının WhatsApp’ta, bir uygulama içinde konuşlandırılabileceğini ve hatta geleneksel sesli aramalarla bile çalışabileceğini söyledi.
Peak XV ve Lightspeed’in desteğini alan Sarvam, yapay zeka ajanlarının fiyatını kullanım başına dakika başına 1 ₹’den (yaklaşık 1 sent) başlatmayı planlıyor.
Girişim, sesle etkinleştirilen AI ajanlarını, 4 trilyon token’lık bir veri kümesi üzerinde eğitilen Sarvam 2B adlı temel, küçük bir dil modelinin üzerine inşa ediyor. Raghavan’a göre model tamamen sentetik veriler üzerinde eğitildi.
Yapay zeka uzmanları, sentetik verileri kullanırken (esas olarak gerçek dünya verilerini kopyalamayı amaçlayan büyük bir dil modeli tarafından üretilen veriler) diğer yapay zeka modellerini eğitmek için dikkatli olunmasını tavsiye eder, çünkü LLM’ler halüsinasyon görme ve doğru olmayabilecek bilgiler uydurma eğilimindedir. Yapay zeka modellerini bu tür veriler üzerinde eğitmek, bu tür yanlışlıkları daha da kötüleştirebilir.
Raghavan, Sarvam’ın açık web’de Hintçe içeriklerin son derece sınırlı erişilebilirliği nedeniyle sentetik veri kullanmayı seçtiğini söyledi. Girişimin, sentetik veri kümelerini oluşturmak için ilk kullanılan verileri temizlemek ve iyileştirmek için modeller geliştirdiğini ekledi.
Kurucusu, Sarvam 2B’nin sektördeki benzerlerinin onda birine mal olacağını iddia etti. Girişim, topluluğun daha da üzerine inşa edeceğini umarak modeli açık kaynaklı hale getiriyor.
Raghavan, “Büyük dil temel modelleri çok heyecan verici olsa da, küçük dil modelleri kullanarak daha üstün, daha spesifik, daha düşük maliyetli ve daha az gecikmeli bir deneyim elde edebilirsiniz” dedi. “Bir hafta veya bir ay içinde bir veya iki sorgu gerçekleştirmek istiyorsanız, büyük dil modellerini kullanmalısınız. Ancak günlük milyonlarca etkileşim gerektiren kullanım durumları için, daha küçük modellerin daha uygun olduğuna inanıyorum.”
Girişim ayrıca Saaras v1 ses kod çözücüsü ve Meta’nın Llama3-8B Instruct’ı üzerine inşa edilmiş Shuka adlı bir ses dili modeli de piyasaya sürüyor. Bu model de açık kaynaklı hale getiriliyor, böylece geliştiriciler ses arayüzleri oluşturmak için girişimin çevirisini, TTS’sini ve diğer modüllerini kullanabiliyor.
Ve “A1” adı verilen bir başka ürün daha var: Avukatlar için tasarlanmış, yönetmeliklere bakabilen, belgeler taslak haline getirebilen, bunları sansürleyebilen ve veri çıkarabilen üretken bir yapay zeka çalışma masası.
Sarvam, ülkenin çıkarlarıyla uyumlu kullanım örneklerini savunan ve hükümetin kendi yapay zeka altyapısını geliştirme çabalarına katkıda bulunan küçük bir Hint girişim grubundan biri.
Dünya çapındaki hükümetler giderek daha fazla “egemen AI” – ulusal düzeyde geliştirilen ve kontrol edilen AI altyapısı – peşinde koşuyor. Bu tür çabaların iddia edilen amacı, veri gizliliğini korumak, ekonomik büyümeyi teşvik etmek ve AI gelişimini kültürel bağlamlarına göre uyarlamaktır. Amerika Birleşik Devletleri ve Çin şu anda bu alanda en büyük yatırımlara sahip ve Hindistan “IndiaAI” programı ve dil-özel modelleriyle onları takip ediyor.
IndiaAI programı kapsamındaki girişimlerden biri IndiaAI Compute Capacity olarak adlandırılıyor ve plan en az 10.000 GPU ile çalışan bir süper bilgisayar kurmak. Geliştirilen modellerden biri olan Bhashini, çeşitli Hint dillerinde dijital hizmetlere erişimi demokratikleştirmeyi amaçlıyor.
Raghavan, girişiminin IndiaAI programına katkıda bulunmaya hazır olduğunu söyledi. Röportajda, “Fırsat çıkarsa hükümetle çalışacağız” dedi.