Yapay zeka ses girişimi ElevenLabs, 80 milyon dolarlık yeni yatırım sayesinde 1 milyar dolarlık unicorn statüsüne ulaştı. Sentetik sesleri piyasadaki en doğal sesler arasındadır.
İngiliz şirket, bir dizi ücretsiz ve ücretli yapay zeka planı sunuyor ve ilk ürününü geçen yılın Ocak ayında beta testi olarak piyasaya sürdü, ticari ortaklıklar ve yeni ürünler ekledi.
ElevenLabs, birkaç dakikalık örnek sesten herhangi bir sesi kopyalama yeteneğine ek olarak, çeşitli aksanları, konuşma tarzlarını ve milletleri içeren bir ses kütüphanesi içerir.
Ana kullanımı eğitim ve eğlence amaçlı içerik oluşturmak olsa da şirket, filmler için dublaj ve çeviri, transkripsiyon oluşturma ve hatta insanlara ses klonlarını ticari olarak lisanslama olanağı da dahil olmak üzere yeni ürünler sunmayı planlıyor.
ElevenLabs’ın özel sesler oluşturmada ne kadar iyi çalıştığını daha iyi anlamak için ChatGPT’ye, Mars’a yapılan ilk insanlı misyon hakkında kısa bir radyo oyunu yazdırdım. Zamanlama için, uzay aracının fırlatılmasından önce meydana gelen bir sorunu içeren bir sahne hazırladım. Her şey yaklaşık 30 dakika sürdü ki bu oldukça hızlı bir süre.
ElevenLabs ne kadar iyi çalışıyor?
Dramamı eski zamanların radyo programı tarzında, spiker ve klasik bilim kurgu sesleriyle tamamlayarak sundum. Tüm sesler ElevenLabs kütüphanesinden seçildi ve sesten konuşmaya yerine metinden konuşmaya kullandım.
Müzik, Google’ın MusicFX deneyi kullanılarak oluşturuldu ancak kullanılan ses efektlerinin tümü, kamu malı lisansı altında Freesound.org’dan alındı. Düzenleme, kendi sentetik ses araçlarına sahip etkileyici bir yapay zeka ağırlıklı ses düzenleme platformu olan Podcastle kullanılarak yapıldı.
Ses kalitesi ve seslerin doğal tonu etkileyiciydi. ElevenLabs’ın sorunu, duyguyu veya performansı yönlendirmenin kolay bir yolunun bulunmamasıdır. Gerçek ses tonunu taklit ettiği için sesten sese modelini başlatmalarının nedenlerinden biri de budur.
Dublaj Stüdyosu ve sesten sese lansmanı
Sesten sese kullanan ürünlerden biri, ElevenLabs’ın özellikle ticari video pazarına odaklanan ilk ürünü olan Dubbing Studio’dur. Bunun nedeni daha yüksek düzeyde gerçekçilik gerektirmesidir. Benim kullandığım gibi metinden konuşmaya araçlar, ticari ve reklamcılık için mükemmeldir.
Dublaj Stüdyosu, bir film veya TV şovundaki her sesi kopyalayabilir ve bu klonlanan sesi, aynı kelimeleri aynı tonda ancak farklı bir dilde söylemek için kullanabilir.
Ayrıca, yazıya aktarılan sesin ekrandakiyle mükemmel şekilde hizalanmasını sağlamak için ses kliplerinin kolay senkronizasyonuna veya enjeksiyonuna da olanak tanır.
Seslendirme sanatçıları üzerindeki etkisi
Gösterim için gerçekçiliği geliştirmek istersem, tüm satırları seslendirmesi için bir aktör kiralayabilir ve ardından her karaktere farklı sesler vermek için ElevenLabs sesten sese aracını kullanabilirim.
Geçen yılki grev sırasında SAG-AFTRA aktörlerinin kaygı duyduğu konu kısmen buydu. Bir stüdyonun aktörlerden oluşan bir ekip kiralaması yerine, bir radyo dramasının, çizgi filmin veya muhtemelen bir video oyununun tamamını seslendirmesi için bir kişiye ödeme yapabilirler.
Dubbing Studio gibi araçlar, İngilizce konuşulmayan ülkelerdeki veya anime veya diğer ithal filmlere ses veren birçok oyuncunun işine de son verebilir.
Dinleyiciler için diğer taraftan, dublajlı programların çok daha hızlı bir şekilde tersine çevrilmesi ve sesli kitapları sesli dramalara dönüştürmenin daha ucuz bir yolu. Buradaki zorluk, insan aktörlerin ses haklarının korunmasını ve kullanımları karşılığında tazminat ödenmesini sağlamanın bir yolunu bulmaktır.

