OpenAI bu haftanın başında çoğu kullanıcının GPT-4o’nun Gelişmiş Ses özelliğine erişebilmek için sonbahara kadar beklemesi gerektiğini duyurmuştu ancak bazı şanslı kişiler yeni nesil sesli asistanla neyin mümkün olabileceğine dair kısa bir bilgi edinmiş gibi görünüyor .
Reddit kullanıcısı RozziTheCreator şanslı birkaç kişiden biriydi. Bir korku hikayesi anlatırken daha önce duymadığımız yeni bir GPT-4o sesinin, gök gürültüsü ve ayak sesleri gibi hikayeye bağlı ses efektleriyle tamamlanan bir kaydını paylaştılar.
Görünüşe göre bu bir hataydı. OpenAI bana yaptığı açıklamada bazı kullanıcıların modele yanlışlıkla erişim sağladığını ancak bunun artık düzeltildiğini söyledi.
Sızdırılan videoda neler duyuluyor?
Benimle dalga geçtiler 🥲 itibaren r/SohbetGPT
Şu ana kadar GPT-4o gelişmiş sese ilişkin sahip olduğumuz her video OpenAI kontrolü altındaydı ve kulağa harika gelse de özel kullanım durumlarıyla sınırlıydı.
RozziTheCreator’ın yeni videosu, daha önce duymadığımız bir ses efektleri özelliği de dahil olmak üzere, bu yeteneği daha doğal bir şekilde gösteriyor gibi görünüyor.
RozziTheCreator’a deneyimim hakkında mesaj attım ve bana “Birdenbire ortaya çıktı, aynı görünüyordu, tek fark sesti.” dediler. Keşif, RozziTheCreator’ın chatbot’a bir soru sormaya çalıştığı gece geç saatlerde gerçekleşti: “Pat, değişikliği keşfettim.”
Sadece birkaç dakika sürdü ve RozziTheCreator’a göre “çok fazla hata vardı” bu yüzden fazla bir şey yayınlamaya vakit yoktu, ancak bu muhteşem hikayenin bir kesitini kaydetmeyi başardılar.
RozziTheCreator’a göre, “Söylemediğim şeyleri tekrarlayıp cevap vermeye başlayınca çıldırdım” ve ardından herkesin zaten kullanabildiği normal temel ses tonuna geri döndü.
Videoda, GPT-4o’nun hikayeyi rahat bir şekilde, ses efektleriyle desteklenmiş bir şekilde hevesle anlattığını duyabilirsiniz. Şöyle diyordu: “Bunu hayal edin, küçük bir kasaba var, herkes herkesi tanıyor gibi bir video ve sokağın sonunda küçük bir ev var.”
Fırtına sırasında “bir el feneri ve ışık için telefonlarından başka bir şey olmadan” evi kontrol eden iki gencin hikayesi devam ediyor.
Peki uygulamada ne gibi sorunlar yaşandı?
OpenAI bir dizi yeni özelliği yavaş yavaş kullanıma sunuyor. İlk Plus kullanıcılarının bu ay GPT-4o gelişmiş ses almaları gerekiyordu, ancak bazı güvenlik sorunları ve donanım altyapısının hazır olup olmadığına ilişkin endişeler nedeniyle gecikti.
OpenAI’ye, RozziTheCreator’ın erişim kazanmasına neden olan şeyin ne olduğunu sordum ve bir sözcü bana şunları söyledi: “Özelliği test ederken, yanlışlıkla az sayıda ChatGPT kullanıcısına davetiye gönderdik. Bu bir hataydı ve düzelttik.”
İlk birkaç Plus kullanıcısının önümüzdeki ay erişim elde edeceğini doğruladılar, ancak çoğu insan için bu biraz daha uzun sürecek. İlk kullanıma sunma işlemini açıklamak, “geri bildirim toplamak ve öğrendiklerimize göre genişletmeyi planlamak” olacaktır.
Yani, henüz GPT-4o sesi yok, ancak bu GPT-4o’nun kısıtlamalarından kurtulmak ve tüm yeteneklerini sunmak istemesinin bir dizi örneğinin sonuncusu. Bir dakika doğrudan ses dosyalarını analiz ettiğini, sonraki dakika ise bunları koddan geçirdiğini kendim gördüm.
Bu durum, cihazın tüm kapasiteleri konusunda daha da heyecanlanmama ve gecikme konusunda daha da sinirlenmeme neden oldu; bu anlaşılabilir bir durum olsa da.