OpenAI, geliştirdiği Voice Engine adlı metinden sese dönüştürme platformuna sınırlı erişim sunuyor. Bu platform, birinin sesinin 15 saniyelik klibini temel alarak sentetik bir ses oluşturabiliyor. Yapay zeka tarafından üretilen ses, komut üzerine metin komutlarını konuşmacıyla aynı dilde veya başka dillerde okuyabilir. OpenAI, “Bu küçük ölçekli dağıtımlar yaklaşımımızı, korumalarımızı ve Voice Engine’in çeşitli endüstrilerde iyi amaçlar için nasıl kullanılabileceği hakkındaki düşüncelerimizi şekillendirmeye yardımcı oluyor” dedi. blog yazısında söyledi.

Erişime sahip şirketler arasında eğitim teknolojisi şirketi Age of Learning, görsel hikaye anlatma platformu HeyGen, ön saflarda yer alan sağlık yazılımı üreticisi Dimagi, yapay zeka iletişim uygulaması yaratıcısı Livox ve sağlık sistemi Lifespan yer alıyor.

OpenAI tarafından yayınlanan bu örneklerde şunları duyabilirsiniz: Öğrenme Yaşı önceden senaryolu seslendirme içeriği oluşturmanın yanı sıra öğrencilere GPT-4 tarafından yazılan “gerçek zamanlı, kişiselleştirilmiş yanıtları” okumak için teknolojiden yararlanıyor.

İlk olarak, İngilizce referans sesi:

Ve işte bu örneğe dayalı olarak yapay zeka tarafından oluşturulan üç ses klibi,

OpenAI, 2022’nin sonlarında Ses Motorunu geliştirmeye başladığını ve teknolojinin halihazırda metinden konuşmaya API ve ChatGPT’nin Yüksek Sesle Okuma özelliği için önceden ayarlanmış sesleri desteklediğini söyledi. ile yapılan bir röportajda TechCrunchOpenAI’nin Voice Engine ürün ekibinin bir üyesi olan Jeff Harris, modelin “lisanslı ve kamuya açık verilerin bir karışımı” üzerinde eğitildiğini söyledi. OpenAI, yayına modelin yalnızca yaklaşık 10 geliştiricinin kullanımına sunulacağını söyledi.

Yapay zeka metinden sese dönüştürme, gelişmeye devam eden üretken yapay zekanın bir alanıdır. Çoğu enstrümantal veya doğal seslere odaklanırken, kısmen OpenAI’nin bahsettiği sorular nedeniyle daha azı ses üretimine odaklandı. Bu alandaki bazı isimler arasında yapay zeka ses klonlama teknolojisi ve araçları sağlayan Podcastle ve ElevenLabs gibi şirketler yer alıyor. Vergecast geçen yıl araştırıldı.

OpenAI’ye göre ortakları, Voice Generation’ı rızaları olmadan kişi veya kuruluşların kimliğine bürünmek için kullanmayacaklarını belirten kullanım politikalarına uymayı kabul etti. Ayrıca ortakların, orijinal konuşmacının “açık ve bilgilendirilmiş onayını” almasını, bireysel kullanıcıların kendi seslerini yaratmaları için yollar oluşturmamasını ve dinleyicilere seslerin yapay zeka tarafından oluşturulduğunu açıklamasını gerektirir. OpenAI ayrıca ses kliplerinin kökenlerini takip etmek ve sesin nasıl kullanıldığını aktif olarak izlemek için filigran ekledi.

OpenAI, banka hesaplarına erişim için ses tabanlı kimlik doğrulamanın aşamalı olarak kaldırılması, yapay zekada insanların seslerinin kullanımını korumaya yönelik politikalar, yapay zeka derin sahtekarlıkları konusunda daha fazla eğitim ve izleme sistemlerinin geliştirilmesi de dahil olmak üzere, bunun gibi araçlarla ilgili riskleri sınırlayabileceğini düşündüğü birkaç adım önerdi. AI içeriği.



genel-2