OpenAI'nin ChatGPT sohbet robotu artık ses ve görüntülerle yönlendirmeyi destekliyor - Dünyadan Güncel Teknoloji Haberleri

OpenAI’nin ChatGPT’de yaptığı değişikliklerin çoğu, yapay zeka destekli botun neler yapabileceğini içeriyor Yapmak: Cevaplayabileceği sorular, erişebileceği bilgiler, geliştirilmiş temel modeller. Ancak bu sefer ChatGPT’yi kullanma şekliniz değiştiriliyor. Şirket, yalnızca bir metin kutusuna cümleler yazarak değil, aynı zamanda yüksek sesle konuşarak veya yalnızca bir resim yükleyerek AI botunu yönlendirmenize olanak tanıyan hizmetin yeni bir sürümünü kullanıma sunuyor. Yeni özellikler önümüzdeki iki hafta içinde ChatGPT’ye ödeme yapanlara sunulacak ve OpenAI’ye göre diğer herkes “kısa süre sonra” bu özelliğe sahip olacak.

Sesli sohbet kısmı oldukça tanıdıktır: Bir düğmeye dokunur ve sorunuzu söylersiniz, ChatGPT bunu metne dönüştürür ve büyük dil modeline besler, yanıt alır, bunu tekrar konuşmaya dönüştürür ve yanıtı yüksek sesle söyler. Sadece Alexa veya Google Asistan ile konuşmak gibi hissettirmeli – OpenAI, gelişmiş temel teknoloji sayesinde yanıtların daha iyi olacağını umuyor. Görünen o ki çoğu sanal asistan yüksek lisans derecelerine dayanacak şekilde yeniden oluşturuluyor; OpenAI oyunun hemen önünde.

OpenAI’nin mükemmel Whisper modeli, konuşmayı metne dönüştürme işinin çoğunu yapıyor ve şirket, “yalnızca metinden ve birkaç saniyelik örnek konuşmadan insan benzeri ses” üretebileceğini söylediği yeni bir metinden konuşmaya modelini piyasaya sürüyor. ” Beş seçenek arasından ChatGPT’nin sesini seçebileceksiniz ancak OpenAI, modelin bundan çok daha fazla potansiyele sahip olduğunu düşünüyor gibi görünüyor. OpenAI, örneğin podcast’leri diğer dillere çevirmek için Spotify ile birlikte çalışıyor; bunu yaparken de podcast yayıncısının sesini koruyor. Sentetik seslerin pek çok ilginç kullanım alanı var ve OpenAI bu sektörün büyük bir parçası olabilir.

Ancak yalnızca birkaç saniyelik ses ile yetenekli bir sentetik ses oluşturabileceğiniz gerçeği, aynı zamanda her türlü sorunlu kullanım durumunun kapısını da açar. Şirket, yeni özellikleri duyuran bir blog yazısında, “Bu yetenekler aynı zamanda kötü niyetli aktörlerin kamuya mal olmuş kişileri taklit etme veya dolandırıcılık yapma potansiyeli gibi yeni riskler de sunuyor” dedi. OpenAI, modelin tam da bu nedenle geniş kullanıma uygun olmadığını söylüyor: Çok daha kontrollü olacak ve belirli kullanım durumları ve ortaklıklarla sınırlandırılacak.

Bu arada görsel arama biraz Google Lens’e benziyor. İlgilendiğiniz şeyin fotoğrafını çekersiniz ve ChatGPT ne sorduğunuzu anlamaya çalışacak ve buna göre yanıt verecektir. Sorgunuzu netleştirmenize yardımcı olması için uygulamanın çizim aracını da kullanabilir veya görselle birlikte konuşarak veya sorular yazabilirsiniz. ChatGPT’nin ileri-geri yapısının yararlı olduğu nokta burasıdır: Bir arama yapıp yanlış yanıt almak ve sonra başka bir arama yapmak yerine, ilerledikçe botu yönlendirebilir ve yanıtı hassaslaştırabilirsiniz. (Bu, Google’ın çok modlu aramayla yaptığı şeye de çok benzer.)

Açıkçası, görsel aramanın da potansiyel sorunları var. Bunlardan biri, bir kişi hakkında bir sohbet robotu başlattığınızda olabilecek şey: OpenAI, hem doğruluk hem de gizlilik nedenleriyle ChatGPT’nin “insanları analiz etme ve insanlar hakkında doğrudan açıklamalar yapma yeteneğini” kasıtlı olarak sınırladığını söylüyor. Bu, yapay zeka için en bilimkurgu vizyonlarından biri anlamına geliyor: birine bakıp “kim o?” diyebilme yeteneği. – yakın zamanda gelmeyecek. Bu muhtemelen iyi bir şey.

ChatGPT’nin ilk lansmanından neredeyse bir yıl sonra OpenAI, yeni sorunlar ve dezavantajlar yaratmadan botuna nasıl daha fazla özellik ve yetenek kazandıracağını bulmaya çalışıyor gibi görünüyor. Bu sürümlerle şirket, yeni modellerinin yapabileceklerini kasıtlı olarak sınırlayarak bu çizgide yürümeye çalıştı. Ancak bu yaklaşım sonsuza kadar işe yaramayacak. Daha fazla kişi sesli kontrolü ve görsel aramayı kullandıkça ve ChatGPT gerçekten çok modlu, kullanışlı bir sanal asistan olmaya yaklaştıkça, korkulukları açık tutmak giderek zorlaşacak.

genel-2

OpenAI’nin ChatGPT sohbet robotu artık ses ve görüntülerle yönlendirmeyi destekliyor

Byteknomers

By teknomers

Benzer İçerikler

Bristol ısı pompası girişimi 727 bin £ hibe aldı

Japon Saat Devi Casio NFT Alanına Giriyor: Ayrıntılar

Seagate’in 2TB Xbox Depolama Genişletme Kartı şimdiye kadarki en iyi indirimini aldı

Yengeç tabanlı soullike, geliştiricinin “en çılgın hayallerinin” ötesine geçiyor

Dünyanın Sonu Bir Sonraki Splatoon 3 Splatfest’te Çağırıyor!

Tetris ve 7-Eleven Birlikte Taşınabilir Bir Oyun Cihazı Piyasaya Sürüyor

İçerik Uyarısı’nda artık filme alınacak daha tuhaf şeyler var

Apple, iPhone satışlarında %10 düşüş bildirdi ancak rekor hisse geri alımının açıklanmasının ardından hisse senetleri yükselişe geçti

iPad’lerle ilgilenmiyor olsanız bile 7 Mayıs’taki etkinlikte Tim Cook’un neler söylediğini duymak isteyebilirsiniz

Google’ın Pixel Watch’unda 100 $ tasarruf etmek ve bütçenizi zorlamadan yeni bir akıllı saat almak için çok geç değil

Samsung One UI 6.1 güncellemesi Galaxy S22, S21 ve daha eski katlanabilir cihazlara dağıtılmaya başladı

İki küçük NASA uydusu toprak nemini ve volkanik gazları ölçecek

Dev Galaktik Patlama Kozmik Kirlilik Dinamiklerini Ortaya Çıkarıyor

Gözlemler, TOI-837 b’nin devasa bir çekirdeğe sahip, Satürn büyüklüğünde genç bir ötegezegen olduğunu ortaya çıkardı

Webb Haritaları Extreme Exoplanet WASP-43 b’de Hava Durumu

İlginizi Çekebilir

Bristol ısı pompası girişimi 727 bin £ hibe aldı

Ukraynalı REvil Hacker’ı 13 Yıl Hapse Mahkûm Edildi ve 16 Milyon Dolar Ödemeye Karar Verildi

‘Wrexham’a Hoş Geldiniz 3. Sezon’u çevrimiçi nasıl izleyebilirsiniz? İstediğiniz yerden yayınlayın

Japon Saat Devi Casio NFT Alanına Giriyor: Ayrıntılar