OpenAI, geçtiğimiz yıl boyunca ChatGPT üretken yapay zeka sohbet robotunu ve Sora yapay zeka video yaratıcısını hızla geliştirdi ve artık gösterilecek yeni bir yapay zeka aracı var: Yalnızca 15 saniyelik sesten sentetik sesler oluşturabilen Ses Üretimi.
İçinde bir blog yazısı (aracılığıyla Sınır), OpenAI, 2022’nin sonlarından bu yana geliştirilmekte olan Voice Engine’in “küçük ölçekli bir önizlemesini” çalıştırdığını söylüyor. Aslında bu özellik zaten ChatGPT uygulamasındaki (adından da anlaşılacağı gibi) Sesli Okuma özelliğinde kullanılıyor. size cevaplar sunuyoruz.
Sesi 15 saniyelik bir örnekten eğittikten sonra, istediğiniz metni “duygusal ve gerçekçi” bir şekilde okumasını sağlayabilirsiniz. OpenAI, eğitim amaçlı, podcast’leri yeni dillere çevirmek, uzak topluluklara ulaşmak ve sözel olmayan kişileri desteklemek için kullanılabileceğini söylüyor.
Bu şu anda herkesin kullanabileceği bir şey değil, ama gidip örnekleri dinle Voice Engine tarafından oluşturulmuştur. OpenAI klipleri oldukça etkileyici ses çıkardı, ancak hafif robotik ve yapmacık bir yanları var.
Önce güvenlik
Kötüye kullanım endişeleri, Voice Engine’in şimdilik yalnızca sınırlı bir ön izlemede olmasının ana nedenidir: OpenAI, bunun gibi araçların yanlış bilgi yaymak ve izinsiz sesleri kopyalamak için kullanılmasını nasıl önleyebileceği konusunda daha fazla araştırma yapmak istediğini söylüyor.
“Sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmayı umuyoruz.” OpenAI diyor. “Bu görüşmelere ve bu küçük ölçekli testlerin sonuçlarına dayanarak, bu teknolojinin geniş ölçekte uygulanıp uygulanmayacağı ve nasıl uygulanacağı konusunda daha bilinçli bir karar vereceğiz.”
Bu yıl hem ABD’de hem de İngiltere’de büyük seçimlerin yapılması ve üretken yapay zeka araçlarının her geçen gün daha da gelişmesiyle birlikte bu, her tür yapay zeka içeriği (ses, metin ve video) için bir endişe kaynağı haline geliyor ve ne yapılması gerektiğini bilmek giderek zorlaşıyor. güven.
OpenAI’nin kendisinin de belirttiği gibi, bunun sesli kimlik doğrulama önlemlerinde sorunlara ve telefonda kiminle konuştuğunuzu veya kimin size sesli mesaj bıraktığını bilemeyebileceğiniz dolandırıcılıklara neden olma potansiyeli vardır. Bunlar çözülmesi kolay sorunlar değil; ancak bunlarla başa çıkmanın yollarını bulmamız gerekecek.