Meta'nın güncellenmiş yapay zekası, metinden konuşmaya dönüştürmeyi daha kusursuz ve etkileyici hale getiriyor - Dünyadan Güncel Teknoloji Haberleri

Meta’nın güncellenmiş yapay zekası, metinden konuşmaya dönüştürmeyi daha kusursuz ve etkileyici hale getiriyor

Meta, Ağustos ayında SeamlessM4T adlı multimodal AI çeviri modelini tanıttı. Bu araç, metin için neredeyse 100 dili ve konuşma için 36 dili destekler. Artık güncellenmiş bir “v2” mimarisiyle şirket, konuşma çevirilerini daha spontane ve anlamlı hale getirmek için aracın yeteneklerini genişletiyor. Anlamlı çevirilerin eksikliği şu ana kadar büyük bir zorluk olduğundan, bu, diller arasında daha özgün konuşmalar yapılmasına yönelik çok önemli bir adımdır.

SeamlessM4T, çeşitli konuşma ve metin işlevleri arasında sorunsuz bir şekilde çeviri yapmak ve yazıya dönüştürmek için tasarlanmıştır. Konuşmadan metne ve metinden metne işlevleri için yaklaşık 100 dili çevirebilir ve aynı dillerde konuşmadan konuşmaya ve metinden konuşmaya özelliklerini destekler. Ayrıca çevirilerin çıktısını İngilizce de dahil olmak üzere diğer 36 dilden herhangi birinde verebilir.

İki yeni özellikten ilkine “Sorunsuz İfade Edici” adı veriliyor. Adından da anlaşılacağı üzere konuşmanızla birlikte ifadelerinizin de tercüme edilmesini sağlar. Bu, perdenizi, ses tonunuzu, duygusal tonunuzu (örneğin heyecan, üzüntü veya fısıltılar), konuşma hızınızı ve duraklamalarınızı içerir. Bu, tercüme edilen konuşmaların kulağa daha az robotik ve daha doğal gelmesini sağlar. Bu özellik İngilizce, İspanyolca, Almanca, Fransızca, İtalyanca ve Çince dahil olmak üzere birçok dili desteklemektedir.

İkinci özelliğe “Kesintisiz Akış” adı verilir. Aracın, konuşmacı hala konuşurken konuşmayı çevirmeye başlamasını sağlar ve diğerlerinin çeviriyi daha hızlı duymasını sağlar. İki saniyenin biraz altındaki kısa bir gecikme olmasına rağmen, birisinin cümlesini bitirmesini bekleme ihtiyacını ortadan kaldırır. Buradaki zorluk, farklı dillerin farklı cümle yapılarına sahip olmasıdır; bu nedenle Meta’nın, çevrilmiş bir çıktı oluşturmaya başlamak için yeterli bağlam olup olmadığını veya dinlemeye devam etmesi gerekip gerekmediğini belirlemek için kısmi ses girdisini inceleyebilecek bir algoritma geliştirmesi gerekiyordu.

SeamlessM4T, mevcut PyTorch tabanlı çoklu görev UnitY model mimarisi üzerine geliştirilmiştir. Bu mimari zaten otomatik konuşma tanımanın yanı sıra farklı modal çevirileri de gerçekleştirme yeteneğine sahip. Ek olarak model, ses kodlaması için girdileri analiz için bileşen belirteçlerine ayıran BERT 2.0 sistemini ve sesli yanıtlar oluşturmak için bir HiFi-GAN birimi ses kodlayıcısını kullanıyor.

FacebookheyecanLinkedIn

makalenin sonu

genel-9

Meta’nın güncellenmiş yapay zekası, metinden konuşmaya dönüştürmeyi daha kusursuz ve etkileyici hale getiriyor

Byteknomers

By teknomers

Benzer İçerikler

NVIDIA GeForce Now oyunlarını Steam Deck’te ve diğer taşınabilir konsollarda oynamak artık daha kolay olacak

Glenn Close ve Jeremy Irons, Huzurevi Komedisi ‘Encore’a Katılıyor

Microsoft, tüm tüketici hesapları için geçiş anahtarı desteğini başlatıyor

Amazon Prime Üyeleri Mayıs’ta Fallout’s Wasteland Gezisi de dahil olmak üzere 9 Ücretsiz Oyun Kazanacak

Turtle Beach Recon Xbox kumandasının fiyatı düşürüldü ve arkadaşlarınızla çevrimiçi sesli sohbet için ideal

Metal Gear Solid Master Koleksiyonunu Steam’de %20 İndirimle Alın

Manor Lords yayıncısının yeni strateji oyunu, istek listeleri arttıkça ertelendi

Apple Watch’un AFib Geçmişi özelliği, güvenilir bir araç olarak FDA’nın onayını alıyor

Yeni ABD raporu, Apple’ın iPhone 15 ailesinin iPhone 14 serisinden çok daha az başarılı olduğunu ortaya koyuyor

Samsung Good Lock uygulaması Google Play Store’a geliyor

Pixel 8a hakkında bilinmesi gereken neredeyse her şey Google’ın lansman etkinliği öncesinde sızdırıldı

Webb Haritaları Extreme Exoplanet WASP-43 b’de Hava Durumu

Bilim adamı karanlık madde ve karanlık enerjinin doğasını anlama arayışını anlatıyor

NASA Astronotları, Boeing’in Starliner Gemisinde Tarihi Gece Fırlatmasına Hazırlanıyor

Yeni Model Garip Davranışları Kozmik Ölçekte Açıklayabilir

İlginizi Çekebilir

Solo 4’ü yener. Beats Studio Pro

NVIDIA GeForce Now oyunlarını Steam Deck’te ve diğer taşınabilir konsollarda oynamak artık daha kolay olacak

Glenn Close ve Jeremy Irons, Huzurevi Komedisi ‘Encore’a Katılıyor

Sevilen büyük strateji oyunu 1.0’a ulaşırken Crusader Kings 3’ün bir rakibi var