OpenAI, İnsan Sesini 15 Saniyelik Sesle Kopyalayabilen 'Voice Engine' Ses Aracının Önizlemesini Yapıyor - Dünyadan Güncel Teknoloji Haberleri

OpenAI, kelimeleri ikna edici bir insan sesiyle yüksek sesle okuyabilen bir özellik için yapılan testin ilk sonuçlarını paylaşıyor; yapay zeka için yeni bir sınırın altını çiziyor ve deepfake riskleri hayaletini artırıyor. Bir sözcü, şirketin şu ana kadar yaklaşık 10 geliştiriciyle paylaştığı Voice Engine adlı metinden konuşmaya modelinin küçük ölçekli ön izlemesinden ilk demoları ve kullanım örneklerini paylaştığını söyledi. OpenAI, bu ayın başlarında gazetecilere bilgi verdiği özelliğin daha geniş bir şekilde kullanıma sunulmasına karşı karar verdi.

OpenAI sözcüsü, şirketin politika yapıcılar, sektör uzmanları, eğitimciler ve yaratıcılar gibi paydaşlardan geri bildirim aldıktan sonra sürümün ölçeğini küçültmeye karar verdiğini söyledi. Daha önceki basın brifingine göre şirket, başlangıçta aracı bir başvuru süreci aracılığıyla 100’e kadar geliştiriciye sunmayı planlamıştı.

Şirket Cuma günkü bir blog yazısında, “İnsan seslerine benzeyen konuşmalar üretmenin ciddi riskler taşıdığının farkındayız ve bu riskler özellikle seçim yılında akla ilk gelenler” diye yazdı. “Geliştirirken onların geri bildirimlerini dahil ettiğimizden emin olmak için hükümet, medya, eğlence, eğitim, sivil toplum ve diğer alanlardan ABD’li ve uluslararası ortaklarla iletişim halindeyiz.”

Bazı bağlamlarda sesleri taklit etmek için diğer yapay zeka teknolojileri zaten kullanıldı. Ocak ayında, Başkan Joe Biden’dan geldiği iddia edilen sahte ama kulağa gerçekçi gelen bir telefon görüşmesi, New Hampshire’daki insanları ön seçimlerde oy kullanmamaya teşvik etti; bu, kritik küresel seçimler öncesinde yapay zeka korkularını körükleyen bir olaydı.

OpenAI’nin ses içeriği üretmeye yönelik önceki çabalarının aksine, Voice Engine, bireysel insanlar gibi ses çıkaran, kendilerine özgü ritim ve tonlamalarla tamamlanan konuşmalar oluşturabilir. Yazılımın ihtiyacı olan tek şey, konuşan bir kişinin sesini yeniden oluşturmak için 15 saniyelik kayıtlı sestir.

Aracın bir gösterimi sırasında Bloomberg, OpenAI İcra Kurulu Başkanı Sam Altman’ın, gerçek konuşmasından farklı olmayan ancak tamamen yapay zeka tarafından üretilmiş bir sesle teknolojiyi kısaca açıklayan bir klibini dinledi.

OpenAI ürün lideri Jeff Harris, “Doğru ses kurulumuna sahipseniz, bu temelde insan kalibresinde bir ses olacaktır” dedi. “Oldukça etkileyici bir teknik kalite.” Ancak Harris şunları söyledi: “İnsan konuşmasını gerçekten doğru bir şekilde taklit etme yeteneği konusunda açıkçası pek çok güvenlik hassasiyeti var.”

OpenAI’nin aracı kullanan mevcut geliştirici ortaklarından biri olan, kâr amacı gütmeyen sağlık sistemi Lifespan’daki Norman Prince Nörobilim Enstitüsü, hastaların seslerini iyileştirmelerine yardımcı olmak için teknolojiyi kullanıyor. Örneğin şirketin blog yazısında, aracın, beyin tümörü nedeniyle net konuşma yeteneğini kaybeden genç bir hastanın, bir okul projesi için daha önceki bir kayıttaki konuşmasını kopyalayarak sesini geri kazandırmak için kullanıldığı belirtildi.

OpenAI’nin özel konuşma modeli, ürettiği sesi farklı dillere de çevirebilir. Bu da onu Spotify Technology SA gibi ses sektöründeki şirketler için faydalı kılıyor. Spotify, Lex Fridman gibi popüler sunucuların podcast’lerini çevirmek için bu teknolojiyi kendi pilot programında zaten kullandı. OpenAI ayrıca çocuklara yönelik eğitim içeriği için daha geniş bir yelpazede ses yaratmak gibi teknolojinin diğer faydalı uygulamalarını da duyurdu.

Test programında OpenAI, ortaklarının kullanım politikalarını kabul etmelerini, sesini kullanmadan önce orijinal konuşmacının onayını almalarını ve dinleyicilere duydukları seslerin yapay zeka tarafından oluşturulduğunu açıklamalarını istiyor. Şirket ayrıca, bir ses parçasının kendi aracı tarafından oluşturulup oluşturulmadığını ayırt edebilmesini sağlamak için duyulamayan bir ses filigranı da kuruyor.

OpenAI, özelliğin daha geniş bir şekilde yayınlanıp yayınlanmayacağına karar vermeden önce, dış uzmanlardan geri bildirim istediğini söyledi. Şirket, blog yazısında şunları söyledi: “Dünyanın her yerindeki insanların, biz onu geniş çapta kendimiz kullansak da kullanmasak da, bu teknolojinin nereye doğru gittiğini anlaması önemlidir.”

OpenAI ayrıca yazılımının önizlemesinin, daha gelişmiş yapay zeka teknolojilerinin getirdiği zorluklara karşı “toplumsal dayanıklılığı artırma ihtiyacını motive etmesini” umduğunu da yazdı. Örneğin şirket, bankalara, banka hesaplarına ve hassas bilgilere erişimde bir güvenlik önlemi olarak sesli kimlik doğrulamayı aşamalı olarak kaldırma çağrısında bulundu. Aynı zamanda yanıltıcı yapay zeka içeriği hakkında kamu eğitimi ve ses içeriğinin gerçek mi yoksa yapay zeka tarafından mı oluşturulduğunu tespit etmeye yönelik tekniklerin daha fazla geliştirilmesini istiyor.

(Bu hikaye NDTV personeli tarafından düzenlenmemiştir ve ortak yayından otomatik olarak oluşturulmuştur.)

Bağlı kuruluş bağlantıları otomatik olarak oluşturulabilir; ayrıntılar için etik bildirimimize bakın.

genel-8

OpenAI, İnsan Sesini 15 Saniyelik Sesle Kopyalayabilen ‘Voice Engine’ Ses Aracının Önizlemesini Yapıyor

Byteknomers

By teknomers

Benzer İçerikler

James Webb Teleskobu, Ana Kuşakta Bazıları Dünya’ya Doğru İlerleyen 138 Yeni Asteroidi Tespit Etti

Önemli çip yapımı malzemelerinin fiyatları, Çin’in ihracat kısıtlamalarının ardından 13 yılın en yüksek seviyesine ulaştı – Çin’in Galyum ihracatına yönelik kısıtlamaları sert darbe aldı

Galaxy S24 Ultra’nın harika ekranı büyük bir sorunu da beraberinde mi getiriyor?

Jurassic Park Klasik Oyunlar Koleksiyonu ve 6 Filmlik 4K Koleksiyonu Amazon’da Satışta

Crunchyroll Ayrıntıları Mart Ana Sayfası Video Yayınları

Crusader Kings 3 Başlangıçtaki Çökme Sorunlarını Düzeltmek İçin PS5’e 1.031.000 Güncellemesi Yayınlandı

Witcher 4’ün yönetmeni, hayranların en sevdiği mini oyun Gwent’in geri dönüşüyle yoğun bir şekilde dalga geçiyor

Mükemmel promosyon, OnePlus Open’ı ücretsiz Buds Pro 3 ve 400 $ indirimle eşleştiriyor

Threads çekiş gücü kazanıyor: Meta’nın X’e rakibi önemli bir dönüm noktasına ulaştı

Amazon size 13 inç iPad Pro M4’ü Kara Cuma fiyatıyla satın almanız için bir şans daha veriyor

Google Drive’ın belge tarayıcısı oyunun kurallarını değiştiren bir yükseltme almak üzere

DAVINCI misyonunun birçok ‘ilk’i, Venüs’ün gizli sırlarını açığa çıkarmayı amaçlıyor

Yeni çalışma, Mars’ta yakın zamanda sıvı su bulmamızın pek mümkün olmadığını söylüyor

Satürn’ün halkaları kaç yaşında? Araştırma onların da tıpkı gezegen gibi 4,5 milyar yaşında olabileceğini öne sürüyor

Space Florida, 1,8 milyar dolarlık gizli Cape Canaveral fırlatma sahası projesini tartışacak

İlginizi Çekebilir

James Webb Teleskobu, Ana Kuşakta Bazıları Dünya’ya Doğru İlerleyen 138 Yeni Asteroidi Tespit Etti

Önemli çip yapımı malzemelerinin fiyatları, Çin’in ihracat kısıtlamalarının ardından 13 yılın en yüksek seviyesine ulaştı – Çin’in Galyum ihracatına yönelik kısıtlamaları sert darbe aldı

Mars yörünge aracı, toz hareketini incelemek için kullanımdan kaldırılan InSight iniş aracını tespit etti

MyOffice’te büyük güncelleme – masaüstü, mobil ve web uygulamaları için birçok yenilik