OpenAI’nin sahip olduğu açıklanmış Yalnızca 15 saniyelik kayıtlı ses ile kişinin sesini yeniden yaratan yeni bir araç.
Dublajlı Ses Motoru adı verilen model, kişinin sesini ve nasıl konuştuğunu öğrenmek için 15 saniyelik tek bir klip çekiyor. Kullanıcılar buradan, duygu içeren gerçekçi seslerle istediklerini söylemek için metin girebilirler. Şirket, 2022 yılında Voice Engine’i geliştirdiğini ve bunu önceden ayarlanmış seslerde kullandığını ancak ilk kez bir kişinin gerçek sesinin kullanılmasının tartışıldığını söyledi. OpenAI ayrıca 29 Mart Cuma günü yayınlanan bir blog yazısında bariz, potansiyel olarak kötü niyetli sonuçları da kabul etti.
OpenAI bir blog yazısında şöyle yazdı: “Sentetik sesin kötüye kullanılması potansiyeli nedeniyle daha geniş bir sürüme yönelik temkinli ve bilinçli bir yaklaşım izliyoruz.” “Sentetik seslerin sorumlu bir şekilde konuşlandırılması ve toplumun bu yeni yeteneklere nasıl uyum sağlayabileceği konusunda bir diyalog başlatmayı umuyoruz.”
OpenAI, bu konuşmaların gidişatına bağlı olarak Voice Engine’in halka nasıl yayınlanacağına veya yayınlanıp yayınlanmayacağına karar vereceğini ekledi.
Şirket şöyle yazdı: “Bu teknolojinin geniş ölçekte uygulanıp uygulanmayacağı ve nasıl uygulanacağı konusunda daha bilinçli bir karar vereceğiz.”
Voice Engine’in etkileri çok büyüktür. Sunumları hızlı bir şekilde kaydetmek veya daha etkili iletişim kurmak gibi çeşitli önemli şekillerde kullanılabilse de, başka birinin sesini yakalamak ve bunu kötü amaçlarla kullanmak hiç de zor değil. Aslında bu tür dolandırıcılıkların çoğu zaten mevcut ve insanları kandırarak para göndermelerini ve dolandırıcılarla bilgi paylaşmalarını sağlamak için kullanılıyorlar.
Orijinal konuşmacıya çok benzeyen, doğal sese sahip bir konuşma oluşturmak için metin girişini ve 15 saniyelik tek bir ses örneğini kullanan bir model olan Voice Engine’in küçük ölçekli bir ön izlemesinden öğrendiklerimizi paylaşıyoruz. https://t.co/yLsfGaVtrZ29 Mart 2024
OpenAI, geri bildirim almanın bu kadar önemli olmasının bu riskle bağlantılı olduğunu savunuyor. Şirket, Voice Engine’i tartışmak üzere ABD genelinde ve uluslararası düzeyde hükümetler, medya şirketleri, eğlence şirketleri ve eğitim kurumlarıyla temas halinde olduğunu söyledi. Bu taraflar şu anda Voice Engine’i test ediyor ve başkalarının kimliğine bürünmemeyi kabul ettiler. Ayrıca sesi dinleyen herkese sesin yapay zeka tarafından oluşturulduğunu açıklamaları gerekir. OpenAI ayrıca filigran da ekledi, böylece dinleyiciler sesin orijinal olmadığını bilecek.
“Sentetik ses teknolojisinin geniş bir dağıtımına, orijinal konuşmacının bilerek sesini hizmete eklediğini doğrulayan ses kimlik doğrulama deneyimlerinin ve çok fazla ses oluşturulmasını algılayan ve engelleyen bir hareketsiz ses listesinin eşlik etmesi gerektiğine inanıyoruz. Şirket, önde gelen isimlere benzer” dedi.
İleriye baktığımızda Voice Engine’in ne olacağı bilinmiyor. Sonunda kamuya açıklanması mümkün olsa da OpenAI bunun kamu yararına olmadığına da karar verebilir. Her iki durumda da şirket, geliştirmenin açıkça mümkün olduğunu ve bunun açıkça burada olduğunu söyledi. Şirket, “Dünyanın her yerindeki insanların bu teknolojinin nereye gittiğini anlaması önemli,” dedi ve “Sonuçta bunu kendimiz geniş çapta kullansak da kullanmasak da.”