Yapay zeka video oluşturma platformu D-Kimlik AI teknolojilerini kullanarak videoları diğer dillere çevirmek için bir araç sunan en son şirkettir. Ancak bu durumda D-ID, AI düzenleme sürecinin bir parçası olarak konuşmacının sesini de klonlar ve dudak hareketlerini çevrilen kelimelerle eşleşecek şekilde değiştirir.

Teknoloji, D-ID’nin daha önceki çalışmalarından kaynaklanıyor; bunu birkaç yıl önce kullanıcıların eski aile fotoğraflarını canlandırdığı viral bir trendden hatırlayabilirsiniz. Daha sonra bu fotoğraflar konuşabiliyordu. Bu başarının ardından, girişim 2022’de Seri B fonlamasında 25 milyon dolar kazandı ve ABD’de yapay zeka destekli videolar yapmak için teknolojisini kullanan artan sayıdaki kurumsal müşterisine hizmet vermeyi hedefliyordu.

Şirketin artık piyasaya sürdüğü AI Video Çevirisi Şu anda D-ID abonelerine ücretsiz olarak sunulan teknoloji, içerik oluşturucular erişimlerini genişletmelerine yardımcı olmak için videolarını otomatik olarak diğer dillere çevirebilir. Toplamda, Arapça, Mandarin, Japonca, Hintçe, İspanyolca ve Fransızca dahil olmak üzere şu anda mevcut 30 dil bulunmaktadır. Bir D-ID aboneliği, en ucuz planı ve AI özelliklerine yönelik kullanılacak en az kredi sayısı için yılda 56 dolardan başlıyor ve ardından kurumsal fiyatlandırmaya geçmeden önce yılda 1.293 dolara çıkıyor.

D-ID, yeni AI video teknolojisinin, müşterilerin pazarlama, eğlence ve sosyal medya gibi alanlarda kampanyalarını küresel bir kitleye ölçeklendirirken yerelleştirme maliyetlerinden tasarruf etmelerine yardımcı olabileceğini öne sürüyor. Teknoloji, hem dublaj hem de AI video için diğer çözümlerle rekabet edecek.

Yıllardır, dublaj teknolojileri video izleyicilerinin kendi dillerinde ses dinlemesini kolaylaştırdı ancak genellikle daha küçük içerik oluşturucular için erişilemezdi. Şirketler teknolojiye erişimi iyileştirdikçe bu durum değişti. Örneğin, YouTube içerik oluşturucularının videolarını diğer dillere çevirerek daha geniş bir kitleyle bağlantı kurmasına yardımcı olmak için tasarlanmış çok dilli bir ses özelliği yayınladı. Tanınmış içerik oluşturucu MrBeast (Jimmy Donaldson) erken benimseyenler arasındaydı ve teknolojiyi kullanarak popüler videolarından birkaçını 11 dile daha getirdi.

Yapay zeka ile ses yaratma, çevirme veya klonlama yeteneği de genişliyor. Microsoft bu yıl, izlerken YouTube videolarını ve diğerlerini çevirmek ve dublajlamak için yapay zekayı kullanacağını duyurdu. Temmuz ayında, yaratıcı platform Vimeo açığa çıktı Ses ve altyazıları çevirmek ve bunu konuşmacının sesini AI teknolojisiyle çoğaltarak yapmak için araçlar. Ayrıca çok sayıda şirket ses klonlama veya AI çeviri araçları (veya bazen her ikisi) sunar; bunlara Descript, ElevenLabs, Speechify, Veed, Camb.ai, Captions.ai ve Akool dahildir, birkaçını saymak gerekirse, ayrıca düzinelerce dil konuşabilen AI avatarları kullanarak videolar oluşturmanıza olanak tanıyan araçlar da dahildir, örneğin HeyGen, Derin beyin yapay zekası ve diğerleri.

Wav2lip gibi dublaj ve dudak senkronizasyonu yapan AI kütüphaneleri, yeni kurulan şirketlerin bu tür araçları geliştirmesini kolaylaştırırken, içerik üreticilerine AI teknolojisini kullanmayı daha kolay ve belki de daha uygun fiyatlı hale getireceklerini söylüyor. (D-ID’nin yeni geliştirdiği Rosetta-1 adlı tescilli modeli, AI Video Translate’e güç veriyor.)

D-ID, yeni Video Çeviri teknolojisinin D-ID Studio ve API’si aracılığıyla kullanılabileceğini söylüyor. Bir aylık deneme sunuluyor ve daha fazlası gösteriler web sitesinde yer almaktadır.

Şirket, videoların 10 saniye ile 5 dakika arasında uzunlukta olabileceğini ve dosya boyutunun 2 GB’ın altında olması gerektiğini söylüyor. Bu özellik, karede yalnızca bir kişi olduğunda çalışır ve en iyi sonuç için, her zaman yüzleri görünür şekilde kameraya bakmaları gerekir.



genel-24