ChatGPT şu anda gündemde olan konu olabilir, ancak Google yıllardır yapay zeka modelleri geliştirmek için çalışıyor. Bu projelerden biri, 1.000’den fazla farklı dili destekleyebilen bir AI dil modelidir.
Ve bir göre yeni güncelleme (yeni sekmede açılır), Google onu oluştururken “kritik bir ilk adım” attı. Şu anda model 100’den fazla farklı dili desteklemektedir; Google’ın yapmak istediğinin yalnızca %10’u.
Google planlarını açıkladı (yeni sekmede açılır) Kasım ayında “Evrensel Konuşma Modeli” (USM) olarak adlandırılan dil modelini oluşturmak için. Görünüşe göre USM, 2 milyar parametreye sahip bir “son teknoloji konuşma modelleri ailesi” ve 12 milyon saat hız ve 300’den fazla dilden 28 milyar metin cümlesi üzerinde eğitildi.
İşlevler, özellikle İngilizce veya Mandarin Çincesi gibi yaygın olarak konuşulan dillerle aynı kaynaklara sahip olmayan diller için otomatik konuşma tanımayı içerecektir.
Ayrıca, videolar için alt yazılar ve altyazılar oluşturmak için YouTube’da zaten kullanılıyor. USM’nin yukarıda belirtilen mevcut 100 dilinden yalnızca 73’ü şu anda sitede destekleniyor olsa da.
USM’nin eğitim rejiminin aşırı teknik ayrıntılarıyla ilgilenenleriniz, bunları şu adreste kontrol edebilir: Google’ın blog gönderisi. (yeni sekmede açılır)
Google şu anda AI çeviri işindeki tek şirket değil, ancak makine öğrenimini çeviriye uygulama olasılığı heyecan verici. Barselona’daki MWC’den yeni dönmüş biri olarak, lisede öğrendiğim İspanyolca’nın sıfır olmadığını söyleyebilirim. Google Çeviri yardımcı oldu, ancak bir konuşmanın ortasındayken özellikle kullanışlı değil.
Google’ın USM ile ne yapmayı planladığı tam olarak belli değil, ancak olasılıklar sonsuz görünüyor. Sistem, ister metin ister yapay konuşma olsun, konuşmayı gerçek zamanlı olarak alıp çevirebilirse paha biçilmez olabilir. Dahası, metni hızlı ve verimli bir şekilde çevirebiliyorsa.
Dahası, önce bize sorulmasına gerek kalmadan bizim için tanıyabilen ve tercüme edebilen artırılmış gerçeklik gözlüklerimiz varsa. Yapay zeka neyin tercüme edilmeyeceğini de tanıyabildiği sürece. İhtiyacımız olan son şey, sürekli olarak tercüme edilen ve kulaklarımıza pompalanan arka plan konuşmalarıdır.
Ancak, USM’nin Google’ın 1.000 dillik yüksek hedefine ulaşması için daha gidilecek çok yol var. Yüzlerce dil harika bir başlangıç, ancak dünya çapında bundan çok daha fazlası var. Bu yüzden sadece bekleyip ne olacağını görmemiz gerekecek.
Google I/O 2023 o kadar da uzak değil ve 20 yapay zeka ürününün yolda olduğu söylentileri ile açılış konuşması sırasında onlar ve USM hakkında daha fazla şey duyabiliriz.