OpenAI, GPT-4 Omni’yi (GPT-4o) lansmanı sırasında tanıttı. Bahar Güncellemesi Pazartesi sabahı San Francisco’da. Baş Teknoloji Sorumlusu Mira Murati ve OpenAI personeli, ikna edici bir şekilde insan gibi konuşan, dost canlısı bir yapay zeka sohbet robotu ile gerçek zamanlı sözlü konuşmalar yapabilen en yeni amiral gemisi modellerini sergiledi.
Murati sahnede “GPT-4o, GPT-4 seviyesinde zeka sağlıyor ancak çok daha hızlı” dedi. “GPT-4o’nun bu paradigmayı, bu etkileşimin çok daha doğal ve çok daha kolay hale geldiği işbirliğinin geleceğine gerçekten kaydırdığını düşünüyoruz.”
GPT-40 Uzun metrajlı filmde yapay zeka asistanını seslendiren Scarlett Johansson’a benzeyen, samimi bir sesle sözlü yönlendirmelere anında yanıt veriyor O. Demolara dayanarak, bu teknoloji aslında filmi gerçeğe dönüştürüyor. GPT-4o’nun konuşmasında duygusal bir tonlama var; bazen heyecan var, bazen de gülüyor. Ayrıca kullanıcıların konuşmalarındaki duygu ve tonlamayı da tanımlayabiliyor. OpenAI personeli, AI sohbet robotlarıyla yapılan görüşmeleri neredeyse hiç gecikme olmadan sergiledi ve hatta sohbet robotu, kesintiye uğradığında hızla dönebildi.
GPT-4o’nun ses yetenekleri etkileyici olsa da Omni çeşitli ortamlarda çalışır. ChatGPT önceden metin, görüntü ve sesi bir yapay zeka modelleri ağı aracılığıyla işlerken, GPT-4o bu üçünü de işleyebilen tek bir modeldir. Bu her şeyin çok daha hızlı çalışmasını sağlar. Modelle sözlü olarak konuşurken telefonunuzun kamerasıyla GPT-4o’ya bir matematik probleminin görüntüsünü gösterebilirsiniz. OpenAI, yeni amiral gemisi modelinin GPT-4 zeka seviyelerinde çalıştığını ve çok dilli, ses ve görüntü yeteneklerinde çığır açan filigranlar belirlediğini söylüyor.
Bu dudak uçuklatan demoyu geçtikten sonra OpenAI, GPT-4o’yu macOS için bir masaüstü uygulaması olarak piyasaya sürüyor. Ücretli kullanıcılar da bugün macOS uygulamasını alıyor ancak GPT-4o gelecekte ücretsiz kullanıcılara da sunulacak. Masaüstü uygulaması, ChatGPT ile doğrudan bilgisayarınızdan sesli görüşmeler başlatmanıza ve ekranınızı minimum sürtünmeyle paylaşmanıza olanak tanır. ChatGPT web sitesi de basitleştirilmiş bir yenilemeye kavuşuyor.
OpenAI personeli Mark Chen ve Barret Zoph, Pazartesi günü sahnede gerçek zamanlı, çok modlu yapay zeka modelinin nasıl çalıştığını gösterdiler. Chen ve Zoph, modelin yanıtlarını değiştirmesini istemek için sözünü kestiğinden, gerçek zamanlı konuşma çoğunlukla harika çalıştı. GPT-4o yatmadan önce hikayeler anlattı, matematik problemlerine yardımcı oldu ve daha fazlasını yaptı. GPT-4 Omni zaman zaman kullanıcıların niyetini anlamakta zorlandı ancak model, hataların üstesinden gelme konusunda oldukça başarılıydı.
Ses modeli, bir hikaye anlatırken, gülerken ve hatta bir noktada “Ne kadar tatlısın” diyebilirken farklı sesler çıkarabiliyordu. OpenAI ekibinin GPT-4o’nun önceki ses modellerine göre daha fazla duyguya sahip olmasını ve daha konuşkan olmasını sağladığı açıktır. Demolarda ChatGPT her zamankinden daha insani görünüyordu.
Bir OpenAI personeli bir tweet ile şunları doğruladı: şirket, LMSYS Org chatbot arenasında GPT-4o’yu test ediyor “Ben de iyi bir gpt2 sohbet robotuyum.” Pek çok kişinin şüphelendiği ve Sam Altman’ın da alay ettiği gibi bunlar üzerinde çalışılan OpenAI modelleriydi. Personele göre, en yeni sohbet robotu, aralarında GPT-4 Turbo ve Claude 3 Opus’un da bulunduğu endüstri liderlerinin de aralarında bulunduğu birçok ölçümde rakiplerini açıkça geride bıraktı.
GPT-4o’nun piyasaya sürülmesi, yapay zeka sohbet robotlarının geleceği için ufuk açıcı bir an gibi görünüyor. Bu teknoloji, ilk sohbet robotlarını rahatsız eden garip gecikmelerin çoğunu ortadan kaldırıyor. GPT-4o ile oldukça kullanışlı bir Siri sürümü hayal etmek kolaydır. Bu gerçek zamanlı yetenekler muhtemelen Nvidia’nın en son çıkarım çipleri sayesindedir; Murati’nin sunumu bitirmeden önce kesinlikle bahsettiği gibi. Ne olursa olsun OpenAI, Pazartesi günkü demoyla yapay zeka inovasyonunda lider olarak hakim konumunu yeniden doğruladı. Şimdi sunumun bize bu şeyin neler yapabileceğine dair doğru bir tasvir verip vermediğini veya bariz kusurlardan kaçınmak için dikkatli bir şekilde sahne yönetimi yapılıp yapılmadığını görmek için bekliyoruz.

