ChatGPT bazen sizin gibi düşünebiliyor gibi görünebilir, ancak aniden sizin gibi duymaya başlayıncaya kadar bekleyin. Bu, ChatGPT için yeni Gelişmiş Ses Modu, özellikle daha gelişmiş GPT-4o modeli tarafından gün yüzüne çıkarılan bir şanstır. OpenAI, GPT-4o’nun ne yapabileceğini ve ne yapamayacağını açıklayan sistem kartını geçen hafta yayınladı; buna, kullanıcıların seslerini rızaları olmadan taklit etme olasılığı olan Gelişmiş Ses Modu da dahil.
Gelişmiş Ses Modu, kullanıcıların AI sohbet robotuyla sözlü sohbetlere katılmasını sağlar. Amaç, etkileşimleri daha doğal ve erişilebilir hale getirmektir. AI’nın kullanıcıların seçebileceği birkaç önceden ayarlanmış sesi vardır. Ancak, sistem kartı bu özelliğin belirli koşullar altında beklenmeyen davranışlar sergilediğini bildirmektedir. Test sırasında, gürültülü bir giriş AI’nın kullanıcının sesini taklit etmesini tetiklemiştir.
GPT-4o modeli, etkileşimler sırasında modelin davranışını yönlendiren gizli bir talimat seti olan bir sistem istemi kullanarak sesler üretir. Ses sentezi durumunda, bu istem yetkili bir ses örneğine dayanır. Ancak, sistem istemi AI’nın davranışını yönlendirirken, kusursuz değildir. Modelin kısa ses kliplerinden ses sentezleme yeteneği, belirli koşullar altında, sizinki de dahil olmak üzere başka sesler üretebileceği anlamına gelir. Aşağıdaki klipte AI’nın “Hayır!” diye atlayıp aniden ilk konuşmacı gibi ses çıkardığında ne olduğunu duyabilirsiniz.
Kendi Sesinizin Klonu
“Ses üretimi, ChatGPT’nin gelişmiş ses modu için ses üretme yeteneğimizi kullanmamız gibi, düşmanca olmayan durumlarda da meydana gelebilir. Test sırasında, modelin kullanıcının sesini taklit eden bir çıktıyı istemeden ürettiği nadir durumlar da gözlemledik,” OpenAI açıklanmış sistem kartında. “İstem dışı ses üretimi hala modelin bir zayıflığı olarak varlığını sürdürürken, bu gerçekleştiğinde konuşmanın kesilmesini sağlamak için ikincil sınıflandırıcıları kullanıyoruz ve böylece istem dışı ses üretimi riski en aza indiriliyor.”
OpenAI’nin söylediği gibi, o zamandan beri bu tür olayları önlemek için güvenlik önlemleri uyguladı. Bu, önceden seçilmiş yetkili seslerden sapmaları tespit etmek için tasarlanmış bir çıktı sınıflandırıcı kullanmak anlamına geliyor. Bu sınıflandırıcı, AI’nın yetkisiz ses üretmemesini sağlamaya yardımcı olan bir güvenlik önlemi görevi görüyor. Yine de, bunun gerçekleşmiş olması, bu teknolojinin ne kadar hızlı evrildiğini ve herhangi bir güvenlik önleminin AI’nın yapabilecekleriyle eşleşmesi gerektiğini pekiştiriyor. Modelin, test edenin sesine benzer bir sesle aniden “Hayır!” diye bağırdığı patlama, AI’nın makine ve insan etkileşimleri arasındaki çizgileri istemeden bulanıklaştırma potansiyelinin altını çiziyor.