OpenAI artık chatbot ChatGPT’nin ses ve görseller kullanarak kullanıcılarla etkileşime girmesine izin veriyor. Bunun anlamı, ChatGPT’nin insanların ne söylediğini duyup anlayabilmesi ve görsel bir ipucuna sahip olup olmadıklarını görebilmesidir.

OpenAI, üretken yapay zeka botu ChatGPT’nin yeteneklerini birkaç kademe artırdı. Artık ChatGPT yalnızca ses tabanlı konuşma yapma değil, aynı zamanda görüntüleri görme ve anlama yeteneğine de sahip.

Bu temel olarak ChatGPT’nin artık kiminle etkileşime girdiğini duyabildiği, konuşabildiği ve görebildiği anlamına geliyor.

ChatGPT’nin yeni özellikleri şu şekilde çalışır.

İlgili Makaleler

SohbetGPT

ChatGPT Dall-E ile Buluşuyor: OpenAI, akıllı istemlere ihtiyaç duymayan Dall-E3 sanat oluşturucuyu güncelledi

SohbetGPT

‘Game of Thrones’un yazarı John Grisham ve diğerleri neden ChatGPT’ye dava açıyor?

Sesli Konuşmalar
Kullanıcılar artık yapay zeka asistanlarıyla dinamik ve etkileşimli diyalogların keyfini çıkararak birçok heyecan verici olasılığın kilidini açabilir. İster hareket halinde olun, ister aileniz için bir uyku öncesi hikayesi arıyor olun, ister bir yemek masası tartışmasını hallediyor olun, ChatGPT’nin ses yetenekleri size yardımcı olmak için hazırdır.

Sesli etkileşimleri başlatmak için mobil uygulamada Ayarlar menüsüne gidin, “Yeni Özellikler”i seçin ve sesli konuşmaları etkinleştirin. Etkinleştirildiğinde, beş farklı ses arasından seçim yapmak için ana ekranın sağ üst köşesindeki kulaklık simgesine dokunmanız yeterlidir.

Bu sesler, insan benzeri bir işitsel deneyim sunmak için profesyonel seslendirme sanatçıları tarafından titizlikle hazırlanmıştır. Ek olarak, OpenAI’nin açık kaynaklı konuşma tanıma sistemi olan Whisper, konuşulan kelimeleri metne dönüştürerek genel konuşma kalitesini artırır.

Görseller ve ChatGPT
Kullanıcılar artık sorun giderme, içerik araştırması veya karmaşık veri analizi için bir veya daha fazla görüntüyü ChatGPT’ye sunabilir. İster ızgaranızın neden başlamadığını teşhis etmeye çalışın, ister buzdolabınızın içeriğine göre bir yemek planlayın, ister iş için bir veri grafiğinin kodunu çözün, ChatGPT size yardımcı olmak için burada.

Bu özelliği kullanmak için, bir görüntü yakalamak veya seçmek üzere fotoğraf düğmesine dokunun. İOS veya Android’de, birden fazla resim eklemek için başlangıçta artı düğmesine dokunun veya asistanınıza rehberlik etmesi için çizim aracını kullanın.

Bu görüntü yetenekleri, dilsel akıl yürütme becerilerini fotoğrafları, ekran görüntülerini ve hem metin hem de görüntüleri içeren belgeleri kapsayan geniş bir görsel içerik yelpazesine uygulayan GPT-3.5 ve GPT-4 dahil çok modlu modellerin gücünden yararlanır.

Güvenlik ve Hızlı Yanıt Verme
Ses ve görüntü özellikleri önümüzdeki iki hafta içinde Plus ve Enterprise kullanıcılarına aşamalı olarak sunulacak. Ses işlevi hem iOS hem de Android platformlarında mevcut olup ayarlardan erişilebilir, görüntü özellikleri ise tüm platformlarda mevcut olacaktır.

Bu gelişmiş yeteneklerle bağlantılı pek çok potansiyel risk vardır. Sesle ilgili olarak, sesli sohbete ağırlık veriliyor ve teknoloji, özgünlüğü ve güvenliği sağlamak için ses aktörleriyle işbirliği içinde geliştirildi.

Görüntü girişiyle ilgili olarak OpenAI, ChatGPT’nin analiz etme ve bireylerin gizliliklerine saygı duyması konusunda doğrudan açıklamalar yapma kapasitesini sınırlamak için önlemler aldı. Gerçek dünyadaki kullanım ve kullanıcı geri bildirimleri, aracın kullanışlılığını sürdürürken bu korumaların daha da geliştirilmesinde önemli bir rol oynayacaktır.



genel-5