Eleven LaboratuvarlarıSentetik sesler oluşturmak için yapay zeka destekli viral platform, yeni bir nakit akışı sağladı.
Bugün girişim, girişimciler Nat Friedman ve Daniel Gross ile Andreessen Horowitz’in ortak liderliğindeki 19 milyon dolarlık A Serisi turunun kapatıldığını duyurdu. Diğer katılımcılar arasında ağır sikletler Creator Ventures, SV Angel, Instagram kurucu ortağı Mike Krieger, Oculus kurucu ortağı Brendan Iribe, Deepmind ve Inflection AI kurucu ortağı Mustafa Suleyman ve O’Reilly Media kurucusu Tim O’Reilly yer aldı.
Konuya aşina olan bir kaynak TechCrunch’a ElevenLabs’in dilimin 99 milyon dolar değerinde olduğunu söylüyor – özellikle girişimin bir yıldan biraz daha uzun bir süre önce başladığı düşünüldüğünde saygın bir rakam.
“Bu yatırım inşaata devam etmek için kullanılacak” onbirLabKurucu ortak ve CEO Mati Staniszewski, TechCrunch’a e-posta yoluyla verdiği demeçte, “.
Son birkaç aydır manşetlere konu olan ElevenLabs, hem iyi Ve iğrenç, daha önce Palantir’de çalışan Staniszewski ve eski bir Google çalışanı olan çocukluk arkadaşı Piotr Dabkowski tarafından kuruldu. Kendi ülkeleri olan Polonya’da büyürken izledikleri Amerikan filmlerinin vasat dublajından ilham alan ikili, daha iyisini yapabilecek bir platform tasarlamaya koyuldu – tabii ki yapay zekadan yararlanarak.
ElevenLabs, sentetik sesleri, klonlanmış sesleri veya çeşitli cinsiyet, yaş ve etnik kökenden insanların seslerini taklit eden tamamen yeni “yapay” sesleri kullanarak metni konuşmaya dönüştürebilir. Şirketin AI metinden konuşmaya modelleri dilden bağımsızdır ve kurumsal müşterilerin bunlara ince ayar yapmasına ve üstüne kendi özel konuşma modellerini oluşturmasına olanak tanır.
A Serisi zam ile aynı zamana denk gelen 15 çalışanlı ElevenLabs, uzun biçimli sözlü içeriği düzenlemek ve oluşturmak için bir iş akışı olan Projeleri başlatıyor. Projeler ile kullanıcılar, platformdan ayrılmak zorunda kalmadan diyalog bölümleri ve hatta sesli kitaplar oluşturabilir.
Staniszewski, “İşletmeden işletmeye ortaklar için teknolojimiz, ölçeklenebilir ve çok dilli sesli kitap oluşturma, video oyunlarında karakterleri seslendirme, dijital makaleleri seslendirme, görme engellilerin çevrimiçi yazılı içeriğe erişmesini destekleme ve yapay zeka radyosunu güçlendirme gibi alanlarda kullanılabilir.” söz konusu.
Ocak ayı sonlarında beta olarak piyasaya sürülen ElevenLabs, ürettiği seslerin son derece yüksek kalitesi, hızlı üretim süreleri ve cömert ücretsiz katmanı sayesinde oldukça hızlı bir şekilde hız kazandı. Ancak daha önce ima edildiği gibi, tanıtım her zaman olumlu olmadı – özellikle kötü aktörler platformu kendi amaçları için kullanmaya başladığında.
Komplo içerikleriyle tanınan kötü şöhretli mesaj panosu 4chan, kullanılmış ElevenLabs’ın aktör Emma Watson gibi ünlüleri taklit eden nefret dolu mesajları paylaşma aracı. Başka bir yerde, The.Verge’den James Vincent, ElevenLabs’e dokunarak hedeflerin seslerini birkaç saniye içinde klonlayabildi — üreten şiddet tehditlerinden ırkçılık ve transfobi ifadelerine kadar her şeyi içeren ses örnekleri.
Yanıt olarak ElevenLabs, ses klonlamayı ücretli hesaplarla sınırlandırmak, hizmet şartlarını tekrar tekrar ihlal eden kullanıcıları yasaklamak ve yeni bir AI tespit aracı sağlamak gibi bir dizi yeni koruma getireceğini söyledi.
Tespit aracı bugün kullanıma sunuluyor. AI Speech Classifier olarak adlandırılan ve “belirli” iş ortakları için bir API olarak kullanılabilen bu araç, yüklenen bir ses örneğinin ElevenLabs’ten yapay zeka tarafından oluşturulmuş içerik içerip içermediğini algılamak için tasarlanmıştır.
Staniszewski, “Üretken yapay zeka platformlarının güvenli bir şekilde benimsenmesini sağlamak, metin, görüntü ve ses platformları da dahil olmak üzere yapay zeka tarafından üretilen tüm sektör için önemli bir zorluktur” dedi. “İnsanların üretken medya ortamının doğası hakkında eğitildiğinden ve bu tür içeriğin orada olduğunu bildiğinden emin olmalıyız – şeffaflık adına insanların yapay zeka tarafından üretilen içeriği algılamasına yardımcı olacak araçlar oluşturmaya kararlıyız.”
Gönüllü bir tespit aracı – reklamı yapıldığı gibi çalıştığını varsayarsak – kötü davranışı mutlaka caydırmaz. Ancak odada ElevenLabs’in ele almadığı başka bir fil daha var: teknolojisinin seslendirme sanatçıları için oluşturduğu varoluşsal tehdit.
Anakart yazar seslendirme sanatçılarından seslerinin haklarını imzalamalarının nasıl giderek daha fazla istendiği hakkında, böylece müşteriler AI’yı sonunda onların yerini alabilecek sentetik versiyonlar oluşturmak için kullanabilirler – bazen ek tazminat ödemeden. Dahili e-postalar görülen Bu arada The New York Times tarafından yazılan, dünyanın en büyük oyun yayıncılarından biri olan Activision Blizzard’ın yapay zeka destekli “ses klonlama” araçları üzerinde çalıştığını belirtiyor.
Görünüşe göre ElevenLabs, sesli kitaplar, video oyunları ve radyo içeriği için Storytel gibi yayıncılar ve TheSoul Publishing ve MNTN gibi medya platformlarıyla yaptığı çalışmaları öne çıkararak bunu olayların doğal ilerlemesi olarak görüyor. (Storytel ve TheSoul Publishing stratejik yatırımcılardır.) Şirket, yaratıcı, eğlence ve yayıncılık alanlarında on yıllık işitsel içerik yaratan bir milyondan fazla kayıtlı kullanıcısı olduğunu iddia ediyor.
ElevenLabs, sonunda, Papercup ve Deepdub gibi girişimlerin izinden giderek ve “duyguları ve tonlamayı bir dilden diğerine aktarabilmek için bir temel” oluşturarak yapay zeka modellerini ses dublajına genişletmeyi planlıyor.
ElevenLabs bir basın açıklamasında, “Bu, orijinal konuşmacının sesini korurken, herhangi bir videonun ilgi çekici, etkili ve ölçeklenebilir bir şekilde herhangi bir dile dublajlanmasını sağlayacak” diye yazıyor. “[We are] AI dublajını geniş ölçekte etkinleştirmek için endüstri ortaklarıyla zaten bir dizi test yürütüyoruz.”
Bankada 21 milyon dolarla (bunun 2 milyon doları Ocak ayındaki ön hazırlık turundan geldi), ElevenLabs -sonuçları kahretsin- filizlenmekte olan üretken ses alanında rakiplerini alt etmeye lazer odaklı. Amazon, Google ve Microsoft gibi yerleşik şirketlerin yanı sıra Murf, Tavus, Resemble AI, Respeecher, Play.ht ve Lovo gibi girişimleri içerir.