Meta aldı Şirket, 100’e kadar dilde konuşma veya metinden dili hızlı ve verimli bir şekilde anlayabildiğini ve her iki iletişim modunda da çeviri üretebildiğini söylediği yeni Kusursuz M4T AI modelinin Salı günü piyasaya sürülmesiyle evrensel bir dil çevirmenine doğru bir adım attı. Birden fazla teknoloji şirketi benzer bir ürün yayınladıson aylarda gelişmiş yapay zeka çeviri modelleri.

İçinde Blog yazısıMeta, yeni çeviri sistemini, yaklaşık 100 farklı dil için konuşma tanıma ve konuşmadan metne çeviri yapabilen “ilk hepsi bir arada çok modlu ve çok dilli yapay zeka çeviri modeli” olarak tanımlıyor. Model aynı zamanda konuşmayı ve metni yorumlayabiliyor ve sırasıyla 36 ve 35 dil için çevrilmiş konuşulan kelimeleri geri verebiliyor. Kesintisiz M4T’nin, kullanıcıların cümlenin ortasında dil değiştirdiğinde de anlayabildiği bildiriliyor; bu, dil araştırmacılarının kod değiştirme olarak adlandırdığı, konuşurken dillerin parçalarını bir araya getiren insanları tercüme etmek için bir model kullanırken yardımcı olabilir.

Meta Araştırma Bilim Adamı Müdürü Paco Guzmán, Gizmodo’ya “SeamlessM4T birleşik, çok dilli bir modeldir, yani sonuç üretmek için ara modellere dayanmaz” dedi. “Konuşmalı çeviriye yönelik diğer basamaklı sistemler genellikle bunu yapar: konuşma tanıma, metin çevirisi, metinden konuşmaya oluşturma. SeamlessM4T bunu tek seferde yapıyor.”

Bir video demosunda Guzmán, “Amacımız daha bağlantılı bir dünya yaratmak” cümlesini söyledi. Model, konuşulan dilin İngilizce olduğunu hemen fark etti ve ardından bunu Rusçaya çevirdi. Bilgisayarlı bir Rus sesi, cümleyi aşağı yukarı insani bir tınıyla tekrarladı.

Geçmişteki diğer çeviri modellerinden farklı olarak SeamlessM4T, Meta’nın sonuçta hataların ve gecikmelerin azalmasına ve kalitenin artmasına yol açacağına inandığı tek bir sistem kullanıyor. Meta, bu hepsi bir arada çevirmen yaklaşımını, Babil balığı evrensel çevirmeniyle karşılaştırdı. Bir Otostopçunun Galaksi Rehberi. Şimdilik buna gerek yok şunu kulağına sok.

Meta, Seamless M4TT’yi Creative Commons lisansı altında yayınlıyor, böylece diğer çevirmenler ve yapay zeka araştırmacıları bunu geliştirebilir. Şirket ayrıca 270.000 saatin üzerinde konuşma ve metin içeren SeamlessAlign meta verilerini de yayınlıyor. Meta, türünün en büyük veri kümesi olduğunu iddia ediyor.

Her ne kadar son aylarda yeni yapay zekanın çoğu şunu işaret etse de büyük dil modellerini kullanmanın güvenilmezliği doğru teslimat için olgusal bilgilerdil çevirisi bu modellerin aslında iyi olduğu bir şeydir.için uygun. Kusursuz M4T, Meta’nın çeviri modellerindeki önceki yinelemeleri sayesinde mümkün olmuştur. Bunlardan biri yeni bir çığır açtı öncelikli olarak konuşulan dil olan Hokkien’i başarıyla konuşulan kelimelere çevirmekyeni bir model için bir ilk. Daha yakın zamanda şirket, Devasa Çok Dilli Konuşma sistem, hangi Meta iddiaları 1.100’den fazla dil için otomatik konuşma algılama ve dil tanımlama sağlayabilir.



genel-7