OpenAI’nin ChatGPT’de yaptığı değişikliklerin çoğu, yapay zeka destekli botun neler yapabileceğini içeriyor Yapmak: Cevaplayabileceği sorular, erişebileceği bilgiler, geliştirilmiş temel modeller. Ancak bu sefer ChatGPT’yi kullanma şekliniz değiştiriliyor. Şirket, yalnızca bir metin kutusuna cümleler yazarak değil, aynı zamanda yüksek sesle konuşarak veya yalnızca bir resim yükleyerek AI botunu yönlendirmenize olanak tanıyan hizmetin yeni bir sürümünü kullanıma sunuyor. Yeni özellikler önümüzdeki iki hafta içinde ChatGPT’ye ödeme yapanlara sunulacak ve OpenAI’ye göre diğer herkes “kısa süre sonra” bu özelliğe sahip olacak.

Sesli sohbet kısmı oldukça tanıdıktır: Bir düğmeye dokunur ve sorunuzu söylersiniz, ChatGPT bunu metne dönüştürür ve büyük dil modeline besler, yanıt alır, bunu tekrar konuşmaya dönüştürür ve yanıtı yüksek sesle söyler. Sadece Alexa veya Google Asistan ile konuşmak gibi hissettirmeli – OpenAI, gelişmiş temel teknoloji sayesinde yanıtların daha iyi olacağını umuyor. Görünen o ki çoğu sanal asistan yüksek lisans derecelerine dayanacak şekilde yeniden oluşturuluyor; OpenAI oyunun hemen önünde.

OpenAI’nin mükemmel Whisper modeli, konuşmayı metne dönüştürme işinin çoğunu yapıyor ve şirket, “yalnızca metinden ve birkaç saniyelik örnek konuşmadan insan benzeri ses” üretebileceğini söylediği yeni bir metinden konuşmaya modelini piyasaya sürüyor. ” Beş seçenek arasından ChatGPT’nin sesini seçebileceksiniz ancak OpenAI, modelin bundan çok daha fazla potansiyele sahip olduğunu düşünüyor gibi görünüyor. OpenAI, örneğin podcast’leri diğer dillere çevirmek için Spotify ile birlikte çalışıyor; bunu yaparken de podcast yayıncısının sesini koruyor. Sentetik seslerin pek çok ilginç kullanım alanı var ve OpenAI bu sektörün büyük bir parçası olabilir.

Ancak yalnızca birkaç saniyelik ses ile yetenekli bir sentetik ses oluşturabileceğiniz gerçeği, aynı zamanda her türlü sorunlu kullanım durumunun kapısını da açar. Şirket, yeni özellikleri duyuran bir blog yazısında, “Bu yetenekler aynı zamanda kötü niyetli aktörlerin kamuya mal olmuş kişileri taklit etme veya dolandırıcılık yapma potansiyeli gibi yeni riskler de sunuyor” dedi. OpenAI, modelin tam da bu nedenle geniş kullanıma uygun olmadığını söylüyor: Çok daha kontrollü olacak ve belirli kullanım durumları ve ortaklıklarla sınırlandırılacak.

Bu arada görsel arama biraz Google Lens’e benziyor. İlgilendiğiniz şeyin fotoğrafını çekersiniz ve ChatGPT ne sorduğunuzu anlamaya çalışacak ve buna göre yanıt verecektir. Sorgunuzu netleştirmenize yardımcı olması için uygulamanın çizim aracını da kullanabilir veya görselle birlikte konuşarak veya sorular yazabilirsiniz. ChatGPT’nin ileri-geri yapısının yararlı olduğu nokta burasıdır: Bir arama yapıp yanlış yanıt almak ve sonra başka bir arama yapmak yerine, ilerledikçe botu yönlendirebilir ve yanıtı hassaslaştırabilirsiniz. (Bu, Google’ın çok modlu aramayla yaptığı şeye de çok benzer.)

Açıkçası, görsel aramanın da potansiyel sorunları var. Bunlardan biri, bir kişi hakkında bir sohbet robotu başlattığınızda olabilecek şey: OpenAI, hem doğruluk hem de gizlilik nedenleriyle ChatGPT’nin “insanları analiz etme ve insanlar hakkında doğrudan açıklamalar yapma yeteneğini” kasıtlı olarak sınırladığını söylüyor. Bu, yapay zeka için en bilimkurgu vizyonlarından biri anlamına geliyor: birine bakıp “kim o?” diyebilme yeteneği. – yakın zamanda gelmeyecek. Bu muhtemelen iyi bir şey.

ChatGPT’nin ilk lansmanından neredeyse bir yıl sonra OpenAI, yeni sorunlar ve dezavantajlar yaratmadan botuna nasıl daha fazla özellik ve yetenek kazandıracağını bulmaya çalışıyor gibi görünüyor. Bu sürümlerle şirket, yeni modellerinin yapabileceklerini kasıtlı olarak sınırlayarak bu çizgide yürümeye çalıştı. Ancak bu yaklaşım sonsuza kadar işe yaramayacak. Daha fazla kişi sesli kontrolü ve görsel aramayı kullandıkça ve ChatGPT gerçekten çok modlu, kullanışlı bir sanal asistan olmaya yaklaştıkça, korkulukları açık tutmak giderek zorlaşacak.



genel-2