Meta*, konuşmayı yazıya dökebilen ve neredeyse 100 dile çevirebilen SeamlessM4T yapay zeka modelini tanıttı.
Şirketin kendisi bunun yapay zeka destekli konuşmayı konuşmaya ve konuşmayı metne dönüştürmede bir atılım olduğunu söylüyor.
Birleştirilmiş modelimiz, farklı dillerden insanların daha etkili bir şekilde iletişim kurmasını sağlayan isteğe bağlı çeviriler sağlar. SeamlessM4T, ayrı bir dil tanımlama modeline ihtiyaç duymadan kaynak dilleri dolaylı olarak tanır
Son cümleye bakılırsa, başlangıçta hem dili tanıyıp metne dönüştürmek hem de tercüme etmek için eğitilmiş bir yapay zeka modelinden bahsediyoruz. Yani bunlar tek bir yazılımdaki iki ayrı model değildir.
Meta, geliştirme sürecinde yaklaşık “on milyarlarca” cümle ve 4 milyon saatlik konuşma kullandı. Buna ek olarak, araştırmacılar 443.000 saatlik konuşmayı metinlerle eşleştirdiler ve 29.000 saatlik konuşma-konuşma eşleşmesi oluşturarak SeamlessM4T’ye konuşmayı metne dönüştürmeyi, metni tercüme etmeyi, metinden konuşma üretmeyi ve hatta aynı dilde konuşulan kelimeleri tercüme etmeyi öğrettiler. başka bir dildeki kelimelere.
Aynı zamanda Meta, modelinin ideal olmadığını anlıyor ve bu nedenle uzun formları ve devlet kurumları ve çeviri yetkilileri tarafından tanınanlar gibi belgeleri çevirmek için SeamlessM4T’nin kullanılmasını önermiyor. Meta ayrıca SeamlessM4T’nin tıbbi veya yasal amaçlarla kullanılmasını da önermez.
Yapay zekanın çalışmalarını bu bağlantıdan test edebilirsiniz.
* Instagram ve Facebook, Rusya’da aşırılıkçı olarak tanınan ve yasaklanan Meta’ya aittir.