Facebook’un ana şirketi Meta Platforms Salı günü, düzinelerce dilde konuşmayı tercüme edebilen ve yazıya dökebilen bir yapay zeka modeli yayınladı; bu, dil farklılıkları arasında gerçek zamanlı iletişimi sağlayan araçlar için potansiyel bir yapı taşıdır.
Şirket şunları söyledi: Blog yazısı SeamlessM4T modelinin, daha önce yalnızca ayrı modellerde mevcut olan teknolojiyi birleştirerek, yaklaşık 100 dilde metin ve konuşma arasındaki çevirilerin yanı sıra 35 dil için tam konuşmadan konuşmaya çeviriyi destekleyebildiğini söyledi.
CEO Mark Zuckerberg, şirketin geleceği üzerine bahse girdiği birbirine bağlı sanal dünyalar kümesi olan meta veri ortamında dünyanın dört bir yanından kullanıcılar arasındaki etkileşimi kolaylaştıracak bu tür araçların hayalini kurduğunu söyledi.
Blog yazısında, Meta’nın modeli ticari olmayan kullanım için kamuya açık hale getirdiği belirtildi.
Dünyanın en büyük sosyal medya şirketi, bu yıl, Microsoft destekli OpenAI ve Alphabet’in Google’ı tarafından satılan tescilli modellere ciddi bir meydan okuma oluşturan Llama adı verilen büyük bir dil modeli de dahil olmak üzere, çoğunlukla ücretsiz AI modellerinden oluşan bir telaş yayınladı.
Zuckerberg, açık bir yapay zeka ekosisteminin Meta’nın avantajına çalıştığını, şirketin modellere erişim için ücret almaktan ziyade, sosyal platformları için tüketiciye yönelik araçların oluşturulmasında etkili bir şekilde kitle kaynak kullanımı yoluyla kazanacağı daha fazla şey olduğunu söylüyor.
Bununla birlikte Meta, modellerini oluşturmak için alınan eğitim verileri konusunda sektörün geri kalanıyla benzer yasal sorularla karşı karşıya.
Temmuz ayında komedyen Sarah Silverman ve diğer iki yazar, şirketleri kitaplarını izinsiz eğitim verileri olarak kullanmakla suçlayarak hem Meta hem de OpenAI aleyhine telif hakkı ihlali davaları açtılar.
Meta araştırmacıları, SeamlessM4T modeli için bir araştırma makalesinde, hangi depo olduğunu belirtmeden, 4 milyon saatlik “taranmış web verilerinin halka açık bir deposundan kaynaklanan ham sesten” ses eğitim verileri topladıklarını söyledi.
Bir Meta sözcüsü, ses verilerinin kaynağına ilişkin sorulara yanıt vermedi.
Araştırma makalesinde, metin verilerinin Wikipedia’dan ve ilgili web sitelerinden içerik çeken, geçen yıl oluşturulan veri kümelerinden geldiği belirtildi.
© Thomson Reuters 2023