ChatGPT, OpenAI ile metin tabanlı bir arama motorundan çok daha fazlasına dönüşüyor duyuruyor bugün karışıma yeni ses ve görüntü tabanlı akıllı özellikler ekliyor.

Son derece popüler olan üretken yapay zeka asistanı, yaklaşık dokuz ay önce piyasaya sürülmesinden bu yana son zamanların en büyük teknoloji başarı öykülerinden biri oldu ve herkesin basit metin tabanlı yönlendirmelerden makaleler, şiirler ve özetler oluşturmasına olanak tanıdı. Ancak artık ChatGPT, kullanıcıların chatbot ile sesli görüşme yapabilmesiyle çok daha etkileşimli hale gelmek üzere.

Duyuru, Amazon’un OpenAI rakibi Anthropic’e 4 milyar dolara kadar yatırım yapmayı taahhüt ettiği gün geldi; bu, Google’ın Bard sohbet robotu aracılığıyla arayı kapatmaya çalışmasını da içeren, dünyanın teknoloji devleri arasındaki daha büyük üretken yapay zeka savaşının bir parçasını oluşturan bir hareket. Meta, bir adım öne geçmesine yardımcı olmak için sağlam bir açık kaynak ahlakını benimsiyor ve Microsoft, kendisini OpenAI ile yakından uyumlu hale getiriyor.

Sohbet başlatıcı

Bugün, OpenAI’nin güçlü büyük dil modelleri (LLM’ler) ile ses tabanlı asistanların tanıdık dünyasını bir araya getirmesiyle, üretken yapay zeka hareketi için kayda değer bir evrime işaret ediyor.

Örneğin, bir kullanıcı ChatGPT’den sözlü olarak, anlatıyı yönlendirecek birkaç sesli ipucuyla birlikte bir uyku vakti hikayesi hazırlamasını isteyebilecek. Ya da kullanıcı, ChatGPT’nin yanıtını sözlü olarak vermesiyle basitçe bir soru sorabilir.

Başka yerlerde, ChatGPT kullanıcıları, örneğin bir şeyin resmini yükleyip ChatGPT’den bunun ne olduğunu açıklamasını istemek veya bir hedefi tamamlamak için talimatlar sağlamak gibi görselleri kullanarak yanıt arayabilecekler.

ChatGPT görsel arama

ChatGPT görsel arama Resim Kredileri: OpenAI

Ses özelliği, metinden ve birkaç saniyelik örnek konuşmadan insan benzeri sesler üretebilen yeni bir metinden konuşmaya modeliyle destekleniyor. OpenAI, sözlü ifadeleri metne dönüştürmek için kullanılan açık kaynaklı Whisper konuşma tanıma sistemi ile beş farklı ses oluşturmak için yerleşik seslendirme sanatçılarıyla birlikte çalıştığını söyledi.

Spotify aynı zamanda lansman ortağı olarak açıklandıMüzik yayını devi, podcast yayıncıları için kendi orijinal seslerini korurken kendi seslerini örneklemelerine ve programlarını İngilizceden İspanyolcaya, Fransızcaya veya Almancaya çevirmelerine olanak tanıyan oldukça hoş yeni bir özellik sunuyor. Ancak görünen o ki OpenAI, bu teknolojiyi kimsenin kullanımına sunmadığı için eleştiri almamaya dikkat ediyor; lansman için özellikle Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons ve Steven Bartlett gibi podcast yayıncıları ile çalıştı.

Şirket bir blog yazısında şöyle yazdı: “Yalnızca birkaç saniyelik gerçek konuşmadan gerçekçi sentetik sesler üretebilen yeni ses teknolojisi, birçok yaratıcı ve erişilebilirlik odaklı uygulamaya kapı açıyor.” “Ancak bu yetenekler, kötü niyetli aktörlerin tanınmış kişileri taklit etme veya dolandırıcılık yapma potansiyeli gibi yeni riskleri de beraberinde getiriyor.”

Yeni özellikler önümüzdeki iki hafta içinde ücretli Plus ve Enterprise abonelerine sunulmaya başlayacak. Ses özelliklerini etkinleştirmek için kullanıcıların uygulamadaki “ayarlar” menüsüne gitmesi, ardından “yeni özellikler”e gitmesi ve sesli görüşmelere kaydolması gerekiyor. Daha sonra sağ üst köşedeki kulaklık düğmesine dokunmaları ve istedikleri sesi seçmeleri gerekir.

Ses, başlangıçta isteğe bağlı beta temelinde ChatGPT Android ve iOS uygulamalarıyla sınırlı olacak, görsel arama ise varsayılan olarak tüm platformlara gelecek.



genel-24