Yeterince gerçekçi görsel deepfake’ler oluşturmak için internetin başvurulan şirketlerinden biri haline gelen şirket, artık sesinizi klonlama ve onu giderek artan çeşitli dillerde konuşmaya zorlama yeteneğine sahip. ElevenLabs Salı günü yaptığı açıklamada, yeni ses klonlamanın artık Ukraynaca, Korece, İsveççe, Arapça ve daha fazlası dahil olmak üzere daha önce olduğundan 22 dili daha desteklediğini duyurdu.
ElevenLa’ya görebs, yeni Çok Dilli v2 modeli toplam 30 dilde “duygusal açıdan zengin” ses üretebileceğini vaat ediyor. Şirket iki yapay zeka ses aracı sunuyor; biri metinden konuşmaya modeli, diğeri ise ödeme yapan kullanıcıların kendi (veya başkalarının) konuşmasının parçalarını modele girerek bir tür ses oluşturmasına olanak tanıyan “VoiceLab”. ses konisi. V2 modeliyle kullanıcılar, oluşturulan bu seslerin Yunanca, Malayca veya Türkçe konuşmaya başlamasını sağlayabilir.
Hizmet, Salı günü ET öğlen saatlerinde şirketin sitesinde yayına girdi. Kullanıcıların, çevrilmiş sesi duymak için metni yalnızca gerçek dilinde yazmaları gerekir ve bu, şirket veya kullanıcılar tarafından oluşturulan herhangi bir ses klonuyla çalışmalıdır. Ana dili İngilizce olan biri olarak, her aksanlı sesin her dili ne kadar iyi temsil ettiğini ölçmek zordur, ancak cümleler ve alıntılar arasında ara sıra nefes kesen duraklamalar nedeniyle konuşmanın doğal görünmesi zaman alır.
ElevenLabs platformu geçen yıl piyasaya sürüldükten sonra tartışmalara da tanık oldu. Şirketin ilk beta platformu, 4Chan kullanıcılarının ünlüleri taklit etmek için sistemlerini kötüye kullandığını gördü. onları ırkçı, kadın düşmanı ve transfobik senaryolar söylemeye zorlamak. Tarafından da kullanıldı AI evanjelistleri seslendirme sanatçılarına saldıracak Ses klonlama teknolojisinin yaygın kullanımından şikayetçi olan. O zamandan beri ElevenLabs, kullanıcıların yalnızca kendi seslerini klonlayabilmelerini sağlamak için entegre yeni önlemler aldığını iddia ediyor. Kullanıcıların konuşmalarını bir metin captcha istemiyle doğrulamaları gerekir; bu komut daha sonra orijinal ses örneğiyle karşılaştırılır.
Şirketin kurucu ortağı, eskiPalantir yönetici Mati Staniszewski, yaptığı açıklamada, “Sonunda yapay zekanın yardımıyla daha fazla dili ve sesi kapsamayı ve içerikteki dil engellerini ortadan kaldırmayı umuyoruz.”
Beta Dışında ElevenLabs, Yapay Zeka Seslerini Medyaya Aktarmaya Çalışıyor
ElevenLabs, yeni dil yeteneklerinin yanı sıra, şirketin bu teknolojiyi medya şirketlerinin kullanımına sunma konusunda daha derinlemesine araştırma yaptığı bir dönemde bu ilerlemenin, yapay zeka ses klonlama teknolojisinin artık beta aşamasında olmadığını gösterdiğini iddia etti. Haziran ayında ElevenLabs şunları aldı: 19 milyon dolarlık tohum finansmanı eski DeepMind başkanının yanı sıra teknoloji kralları Andreesen Horowitz gibi isimlerden de Inflection AI kurucu ortağı Mustafa Süleyman.
ElevenLabs, şirketlerin sesli kitaplar, videolar ve hatta video oyunlarında sesli NPC’ler oluşturmasının bir yolu olarak ses klonlama teknolojisini tanıtıyor. Şirket iddialar gibi oyunların arkasındaki yayıncı Paradox Interactive ile bir anlaşma yapıldı. Demir Kalpler dizi ve gelecek Lamplighters Ligi. Şirketin ses klonlama teknolojisinden açıkça alıntı yapıldı teknolojinin işlerini baltalamak için kullanıldığından endişe duyan aktörlerin oyun seslendirmesi.
Gizmodo yorum yapmak için Paradox’a ulaştı ancak hemen yanıt alamadık.
Kitaplar cephesinde, Google ve Apple gibi teknoloji devleri yapay zeka destekli sesli kitapları öne çıkarmaya çalıştı. Apple’ın Kitaplar uygulaması anlatıcıları göstermeye başladı bazı içerikleri seslendirmek için “Archie” ve “Warren” gibi yumuşak isimlerle. Sesli kitapları dinleyenler bu seslerin -daha iyi bir terim olmadığı için- olduğunu belirtmişlerdir.cansız bir anlatının yükselişine ve düşüşüne gerçekten dikkat edebilen profesyonel seslendirme sanatçılarının stokuyla karşılaştırıldığında. Aktörler birliği SAG-AFTRA ve Amerika Yazarlar Birliği şu anda grevde ve eğlence sektörüyle devam eden müzakerelerin büyük bir kısmı da bu yönde. Yapay zekaya odaklandık.
Ancak ElevenLabs, yapay zeka seslerinin yayıncılık şirketlerine sesli kitap oluştururken hem zamandan hem de paradan tasarruf sağlayabileceğini öne sürüyor. Pazartesi günü yayınlanan bir blog yazısında şirket terfi ettirildi sesli kitap işlemesinde ince ayarlar yapmak için bir edebiyat ajansı ve küçük bağımsız yayıncılık şirketi olan Lukeman Literary ile birlikte çalıştı. Şirket, Lukeman’ın tek bir sesli kitap üretmesinin “haftalar” sürdüğünü, ancak yapay zeka sayesinde bunun yalnızca saatlere kısaltıldığını iddia etti.
Lukeman Literary, diğer kurgu eserlerinin yanı sıra Rutger Hauer ve Dalai Lama gibi ünlü isimlerin kitaplarının yayınlanmasına yardımcı oldu. Gizmodo’ya gönderilen bir e-postada Lukeman, ajansının ve yayıncılık kollarının farklı olduğunu, dolayısıyla ajansın temsil edilen başlıklarını yapay zeka anlatımına dönüştürmeye yönelik herhangi bir planın olmadığını vurguladı. Yine de yayıncılık işine gelince, “kalite” olmadığı için yapay zeka anlatımını hiçbir zaman benimsemediğini, ancak ElevenLabs’ın özelliklerini test ettiğinden beri onu kullanacak kadar “nihayet etkilendiğini” söyledi. Ayrıca, “Yapay zeka anlatımının bağımsız yazarlar için bir lütuf olduğunu” çünkü bunun insan anlatımı yapmaktan çok daha ucuz olduğunu iddia etti.
Yapay zeka sesinin nihayet prime time için yeterince iyi olduğunu ilan etmesine rağmen Lukeman, yapay zekanın seslendirme sanatçıları için “kesinlikle bir zorluk teşkil edeceğini” kabul etti ancak “bazı” yazarların ve yayıncıların yine de gerçek bir insan tarafından seslendirilen sesli kitap isteyeceklerini öne sürdü.
Seslendirme sanatçıları eninde sonunda artıklar için seslerini yapay zekaya lisanslayabilecek olsun ya da olmasın, bu tür anlaşmalar yayıncılık endüstrisi için hâlâ yabancıdır. giderek daha çok aşık oluyorum yapay zeka ile. Grev halen devam ederken, sesli kitap trendinden para kazanmanın bir yolunu arayan ancak gerçek insan sesinin olmadığı bir sektöre aktörlerin genel olarak nasıl tepki verdiğini öğrenmek zaman alabilir.

