OpenAI, ChatGPT’nin neredeyse yedi ay önce tanıtımını yaptığı gerçek zamanlı video özelliklerini nihayet yayınladı.
Perşembe günü canlı yayın sırasında şirket, ChatGPT için insan benzeri konuşma özelliği olan Gelişmiş Ses Modunun görüş kazandığını söyledi. ChatGPT Plus, Team ve Pro’ya abone olan kullanıcılar, ChatGPT uygulamasını kullanarak telefonlarını nesnelere doğrultabilir ve ChatGPT’nin neredeyse gerçek zamanlı olarak yanıt vermesini sağlayabilir.
Görme özelliğine sahip Gelişmiş Ses Modu, ekran paylaşımı yoluyla cihazın ekranında ne olduğunu da anlayabilir. Örneğin çeşitli ayar menülerini açıklayabilir veya bir matematik problemine ilişkin önerilerde bulunabilir.
Gelişmiş Ses Moduna görsel olarak erişmek için, ChatGPT sohbet çubuğunun yanındaki ses simgesine dokunun, ardından sol alttaki video simgesine dokunun; bu, videoyu başlatacaktır. Ekranı paylaşmak için üç noktalı menüye dokunun ve “Ekranı Paylaş”ı seçin.
OpenAI, Gelişmiş Ses Modunun vizyonla kullanıma sunulmasının bugün başlayacağını ve önümüzdeki hafta tamamlanacağını söylüyor. Ancak tüm kullanıcılar erişim sağlayamayacaktır. OpenAI, ChatGPT Enterprise ve Edu abonelerinin bu özelliği Ocak ayına kadar alamayacaklarını ve AB, İsviçre, İzlanda, Norveç ve Lihtenştayn’daki ChatGPT kullanıcıları için herhangi bir zaman çizelgesinin bulunmadığını söylüyor.
bir son demo CNN’in 60 Dakika programında OpenAI başkanı Greg Brockman, Anderson Cooper’ın anatomi becerileriyle ilgili görsel testini içeren Gelişmiş Ses Moduna sahipti. Cooper karatahtaya vücut parçaları çizerken ChatGPT onun ne çizdiğini “anlayabiliyordu”.

Asistan, “Konum tam yerinde” dedi. “Beyin tam orada, kafanın içinde. Şekle gelince, bu iyi bir başlangıç. Beyin daha çok ovaldir.”
Ancak aynı demoda, görme özelliğine sahip Gelişmiş Ses Modu bir geometri probleminde hata yaptı; bu da halüsinasyona yatkın olduğunu gösteriyor.
Görme özelliğine sahip Gelişmiş Ses Modu birçok kez ertelendi — bildirildiğine göre kısmen OpenAI’nin özelliği üretime hazır olmadan çok önce duyurması nedeniyle. Nisan ayında OpenAI, Gelişmiş Ses Modunun “birkaç hafta içinde” kullanıcılara sunulacağına söz verdi. Aylar sonra şirket daha fazla zamana ihtiyacı olduğunu söyledi.
Gelişmiş Ses Modu nihayet sonbaharın başlarında bazı ChatGPT kullanıcılarına ulaştığında görsel analiz bileşeninden yoksundu. Bugünkü lansman öncesinde OpenAI, dikkatinin çoğunu yalnızca ses Gelişmiş Ses Modu deneyimini ek platformlara getirmeye odakladı ve AB’deki kullanıcılar.
OpenAI, vizyon özellikli Gelişmiş Ses Moduna ek olarak, Noel Baba’nın sesini ChatGPT Gelişmiş Ses Moduna önceden ayarlanmış bir ses olarak ekleyen şenlikli bir “Noel Baba Modu” başlattı. Kullanıcılar bunu ChatGPT’de bilgi istemi çubuğunun yanındaki kar tanesi simgesine dokunarak veya tıklayarak bulabilirler.

