OpenAI, Voice Engine adlı yeni bir aracın lansmanını duyurdu. Bu, 15 saniyelik bir ses örneğini analiz ettikten sonra herhangi bir kişinin konuşmasını taklit etmenize olanak tanıyan bir ses klonlama teknolojisidir. Şirket, Ses Motorunun “duygusal ve gerçekçi seslerle” “doğal ses veren konuşma” ürettiğini söylüyor.
Bu teknolojinin temeli, OpenAI’nin 2022’den beri geliştirmekte olduğu halihazırda mevcut olan metinden konuşmaya API’ydi. Şirket, bu aracı halihazırda metinden konuşmaya API’nin mevcut sürümünde bulunan sesleri ve yüksek sesle okuma özelliğini desteklemek için kullanıyor. Şirketin resmi blogunda gerçek seslere çok yakın ses veren birçok örnek bulabilirsiniz.
OpenAI, Voice Engine’in okuma, dil çevirisi ve konuşma bozukluğu olan insanlara yardım etmek için yararlı bir araç olabileceğine inanıyor. Brown Üniversitesi ile yapılan bir pilot projede şirket, bir okul projesi için yapılan ses kayıtlarına dayanarak konuşma sorunu yaşayan bir hastanın sesinin bir klonunu oluşturarak ona yardımcı olmak için Voice Engine’i kullandı.
Ancak bu teknolojinin saldırganlar tarafından kötüye kullanılması olasılığı konusunda endişeler var. Bu nedenle Voice Engine henüz geniş ölçekte kullanıma sunulmaya hazır değil çünkü hâlâ çözülmesi gereken gizlilik sorunları var.
OpenAI, bu teknolojinin özellikle seçim yılında ciddi riskler taşıdığını kabul ediyor. Şirket, bir ürünü piyasaya sürerken riskleri en aza indirmek için “ABD’li ve hükümet, medya, eğlence, eğitim ve sivil toplum dahil olmak üzere uluslararası ortaklardan” geri bildirim kabul ediyor. Tüm prototip test uzmanları, sesin izin veya yasal hak olmadan kullanılmasını yasaklayan OpenAI kullanım politikasını kabul etti.
Ayrıca bu teknolojinin kullanıcılarının, izleyicilerine oyların yapay zeka tarafından oluşturulduğunu bildirmesi gerekiyor. OpenAI, sistemin istenmeyen kullanımını önlemek için ses kaynağı izleme ve “önleyici izleme” gibi güvenlik önlemleri alır. Ses Motoru resmi olarak piyasaya sürüldüğünde, AI tarafından üretilen ve ünlü kişilere çok benzeyen sesleri önlemek için bir “yasaklı ses listesi” sunacak.
Şu ana kadar OpenAI bu teknolojinin kesin lansman tarihini açıklamadı. Bazı fiyatlandırma verileri, Voice Engine’in ElevenLabs gibi rakip ürünlerle karşılaştırıldığında daha uygun fiyatlı bir seçenek olabileceğini öne sürüyor. Voice Engine’in maliyeti milyon “karakter” başına 15 dolardır; bu da yaklaşık 162.500 kelime anlamına gelir. Bu yaklaşık olarak Stephen King’in The Shining adlı eserinin uzunluğu kadardır. Pazarlama materyalleri ayrıca iki kat daha pahalı olan HD versiyonundan da bahsediyor, ancak şirket avantajının ne olduğunu belirtmedi.
Bu hafta OpenAI, Stargate adında bir yapay zeka süper bilgisayarı oluşturmak için Microsoft ile de ortaklık kurdu. Projenin maliyeti 100 milyar dolar.