Şirket evrensel bir çevirmen yapmaya devam ederken Meta, SeamlessM4T adı verilen yaklaşık 100 dili çevirebilen yeni bir konuşmayı metne dönüştürme modelini yayınladı.

SorunsuzM4TŞirket, Devasa Çok Dilli ve Çok Modlu Makine Çevirisi anlamına gelen ve yaklaşık 100 dilde konuşmayı metne ve metinden metne çeviri yapabildiğini belirtti. Konuşmadan konuşmaya ve metinden konuşmaya eylemleri için 100 giriş dilini tanır ve bunları 35 çıkış diline dönüştürür.

Bir kapsamında serbest bırakılır Creative Commons CC BY-NC 4.0 lisans, araştırmacıların bunu yinelemelerine olanak tanıyor.

Meta, SeamlessM4T ile birlikte açık çeviri veri kümesi SeamlessAlign’ın meta verilerini de yayınladı.

“Kurgusal Babil Balığı gibi evrensel bir dil çevirmeni oluşturmak Bir Otostopçunun Galaksi RehberiMeta, mevcut konuşma-konuşma ve konuşma-metin sistemleri dünya dillerinin yalnızca küçük bir kısmını kapsadığı için zorlu bir çalışmadır” dedi.

Otostopçunun Rehberi Babel Fish, yazar Douglas Adams’ın tasarladığı şekliyle, herhangi bir dili anında anlamak için kulağınıza yerleştirebileceğiniz bir balıktır. eğer bir Doktor Kim hayranıysanız, Meta’nın aracını TARDIS’teki yabancı kelimeleri bile İngilizceye çeviren bir çeviri matrisiyle karşılaştırabilirsiniz.

Meta, SeamlessM4T’nin “önemli bir atılım” temsil ettiğini çünkü bu yeni modelin, çeviriyi farklı sistemlere bölen diğer büyük çeviri modellerinin aksine tüm çeviri görevini tek seferde gerçekleştirdiğini söyledi.

SeamlessM4T’nin ilginç özelliklerinden biri, eğer düzgün çalışabiliyorsa, bir konuşmacının kod değiştirdiğini veya birinin bir cümlede iki veya daha fazla dil arasında geçiş yaptığını iddia ettiği iddia edilen yeteneğidir. Örneğin Meta, bir videoda modelin Hintçe, Telugu dili ve İngilizce arasında hemen ayrım yaptığını gösterdi. Modeli test etmedim, ancak farklı dilleri konuşan çoğu insanın yaptığı gibi sık sık iki ana dilim (Filipince ve İngilizce) arasında kod geçişi yapıyorum ve kişisel deneyimime göre bu, çoğu AI konuşma tanıma yazılımının anladığı bir şey değil. hızlıca.

SeamlessM4T, Meta’nın önceki çeviri modellerini temel alır. Geçen yıl Meta, 200 dili destekleyen, Geride Kalan Dil Yok metinden metne makine çevirisi modelini yayınladı. Çok dilli konuşmadan konuşmaya çeviri için bir veri kümesi olan SpeechMatrix’i ve konuşma tanıma için Massively Multilingual Speech’i geliştirdi. Meta, geçtiğimiz yıl Evrensel Konuşma Tercümanı’nın tanıtımını yaparak Çin’de yaygın olarak kullanılan ve resmi bir yazı sistemi olmayan bir dil olan Hokkien dilini İngilizceye dönüştürdü.

Dil çevirisi, farklı dillerdeki Facebook ve Instagram paylaşımlarını yönetmek için binlerce kişiyi istihdam eden Meta gibi şirketler için önemlidir. Çoğu zaman, ana dal dışı dillerin daha küçük ekipleri vardır ve bu dillerde pek işe yaramayan otomatik denetime bağımlı hale gelirler. Yapay zeka, bu küçük dillerden oluşan bir veri kümesine erişim verilirse, Meta gibi şirketlerin denetimi iyileştirmesine yönelik bir araç olabilir.

Meta, SeamlessM4T’yi oluşturmak için Fairseq dizi modelleme araç setini daha hafif modeller oluşturacak ve daha fazla bilgiyi işleyecek şekilde yeniden tasarladığını söyledi.

Meta, SeamlessM4T’yi geliştirirken zehirli veya hassas kelimeleri tanımlayan bir sistem kurduğunu söyledi. Meta, zehirli kelimeleri “çevirinin nefreti, şiddeti, küfürü veya istismarı teşvik edebileceği” durumlar olarak tanımlıyor. Amaç, çıktı çevirisinin orijinal materyalde bulunmayan toksisiteyi ne zaman ortaya çıkardığını tespit edebilmektir.

“Eğitim verilerindeki dengesiz toksisiteyi filtreledik. Girdi veya çıktı farklı miktarlarda toksisite içeriyorsa, bu eğitim dizisini kaldırdık” dedi Meta.

Araştırmacılar ayrıca bazı küfürleri yanlış çeviren veri kümelerini de temizlemeye çalıştı, böylece bunların kullanıldığını daha doğru bir şekilde tespit edebildi.

Meta, dillerdeki cinsiyet önyargısını da tanıdığını iddia ediyor ve modelin çevirilerdeki cinsiyet önyargısını ölçebileceğini söylüyor. SeamlessM4T, cümlenin bir kelimenin cinsiyetlendirilmiş bir formunu kullanıp kullanmadığını kontrol edebilir. doktor İspanyolca konuşun ve gerekirse hedef dilde eşit cinsiyete sahip dilbilgisi olmadan bir kadın zamir atayın. Buna toksisiteye benzer şekilde yaklaşan Meta, SeamlessM4T’nin bir çevirinin orijinal dilde özel olarak cinsiyetlendirilmemiş terimlere kaç kez cinsiyetlendirilmiş kelimeler eklendiğini saydığını, yani İngilizce dilinde cinsiyet ayrımı olmadığında otomatik olarak doktorun erkek olduğunu varsaydığını söyledi.

Meta, AI modellerinin çoğunu geliştiricilere ve araştırmacılara az çok açık kaynaklı bir şekilde yayınlıyor. Yakın zamanda metinden sese dönüştürmeye izin veren kod olan AudioCraft’ı piyasaya sürdü. Meta aynı zamanda geniş dil modeli Llama 2’ye de erişim sağladı.



genel-2