OpenAI Pazartesi günü yaptığı duyuruda, ChatGPT’nin sesli konuşma ve görüntü tanıma desteğiyle güncellendiğini duyurdu. Şirketin yapay zeka destekli sohbet robotu, yakında kullanıcılar tarafından çekilen veya paylaşılan görüntüleri anlayabilecek ve sohbet robotunun mevcut olduğu platformlarda ayrıntıları veya ilgili bilgileri sunabilecek. Ayrıca OpenAI’nin Whisper konuşma tanıma aracını ve şirketin ChatGPT uygulamasında “insan benzeri” ses sunduğu iddia edilen yeni bir metinden konuşmaya (TTS) teknolojisini kullanarak ileri geri konuşma yeteneğine de sahip olacak. akıllı telefonlar.
OpenAI bir açıklamayla ortaya çıktı Blog yazısı Şirketin ChatGPT için yeni görüntü tanıma yeteneğinin tüm platformlarda mevcut olacağını, sesli konuşma özelliğinin ise iOS ve Android’de bir tercih ayarı aracılığıyla mevcut olacağını söyledi. Bu özellikler ChatGPT Plus ve Enterprise abonelerine sunulacak ve gelecekte ücretsiz katmandaki kullanıcılara sunulup sunulmayacağına dair bir bilgi yok.
ChatGPT’ye gelen sesli görüşmeler şu adrese giderek etkinleştirilebilir: Ayarlar > Yeni özellikler ve sesli konuşmaları etkinleştirme seçeneğinin değiştirilmesi. Daha sonra beş ses arasından seçim yapabilirsiniz; OpenAI, yeni özelliği sunmak için profesyonel seslendirme sanatçılarıyla çalıştığını söylüyor. ChatGPT uygulaması, sözlü sorgularınızı chatbot tarafından anlaşılabilecek metne dönüştürerek sorulara yanıt verebilecek ve yanıtlar şirketin yeni TTS teknolojisi kullanılarak sese dönüştürülecek.
OpenAI’nin yeni TTS teknolojisini kullanacak tek hizmet ChatGPT değil – Pazartesi günü Spotify, podcast yaratıcıları için bir podcast’i İngilizceden Fransızcaya, Almancaya ve İspanyolcaya otomatik olarak çevirebilen yeni bir AI tabanlı ses çeviri aracını duyurdu. Araç birkaç podcast sunucusunda test ediliyor ve yayın platformuna göre çevrilmiş bölümler Spotify’ın mevcut olduğu her yerde tüm kullanıcılara sunulacak.
OpenAI, yeni görüntü tanıma aracının şirketin çok modlu GPT-3.5 ve GPT-4 modellerinde çalıştığını ve fotoğraflarda, ekran görüntülerinde ve belgelerde bulunan görüntü ve metinleri analiz edebildiğini söylüyor. Kullanıcılar, sohbet robotundan bilgi almak için bir görüntü yakalayabilir veya telefonlarında mevcut bir görüntüyü ChatGPT ile paylaşabilir.
OpenAI’ye göre ChatGPT, kullanıcıların chatbot ile tartışılabilecek birden fazla görüntüyü paylaşmasına da olanak tanıyacak. Belirli bir alana odaklanmasını istiyorsanız yerleşik çizim aracı görüntünün bir bölümünü işaretlemenize olanak tanır. Örneğin, ChatGPT ile paylaşılan bir fotoğrafta yerinden çıkmış bir bisiklet zincirinin çevresini çizmek, sohbet robotunun size sorunu çözmenin yollarını göstermesine olanak tanıyabilir.