Lanet olsun! Yeni ChatGPT-4o, OpenAI’den ilk canlı demolarını aldı ve Siri’nin düpedüz ilkel görünmesini sağlıyor.
Gerçek duyguları ifade edebilen, gerçek zamanlı çeviriler yapabilen ve doğrusal denklemleri çözmekten ruh halinizi tahmin etmeye kadar her şeyi yapmanıza yardımcı olmak için Google Lens gibi görme özelliklerini kullanabilen bir sohbet robotundan bahsediyoruz.
Evet, GPT-4o sesli asistanı gerçek zamanlı konuşma konuşması yapabilir. İlk demoda, OpenAI araştırmacılarından biri olan Mark’ın, canlı bir demo verdiği için GPT-4o’dan sinirlerini sakinleştirmesine yardım etmesini istediğini görüyoruz. Sohbet robotu bunun harika olduğunu söylüyor ve heyecanlı görünüyor ve ona bir nefes alma seansı boyunca rehberlik etmeye devam ediyor.
Mark kasıtlı olarak ağır ve hızlı nefes alıyor ve GPT-4o mizahla onun “elektrikli süpürge olmadığını” söylüyor. Asistan, sesin senkronize olmaması nedeniyle biraz takılıp kalıyor ancak genel olarak çok etkileyici. Ve istediğiniz zaman vites değiştirebilmeniz için modeli yarıda kesebilirsiniz.
GPT-4o’nun duyguyu algılayabildiğini belirtmek önemlidir. Ama aynı zamanda duygu da yaratabilir. Örneğin Mark, sesli asistandan yatmadan önce bir hikaye okumasını istedi ve hikayenin daha etkileyici ve dramatik olması konusunda talimatlar vermeye devam etti. Yani “Sesinde biraz daha duygu ve biraz drama istiyorum” diyebilirsin.
Sonuç olarak, GPT-4o çok daha büyük bir tutkuyla okuyor ve asistan, robot sesli komutlara bile geçiş yapabiliyor. Hatta şarkı söylemesini bile isteyebilirsiniz ve o da buna uyar.
Sırada vizyon var. OpenAI, GPT-4o’ya doğrusal bir matematik sorusu gösterdi ve asistan, daha gösterilmeden bir sorunu çözmeye çalışarak acele etti. Ama burada bile “Vay canına, çok heyecanlandım” diyerek duygu gösterdi.
Sonunda GPT-4o “3x +1 = 4” denklemini tanıdı ve cevabını vermeden bunun nasıl çözüleceğine dair ipuçları verdi. Bu, GPT-4o’yu iyi bir ev ödevi yardımcısı haline getirebilir.
GPT-4o ayrıca bilgisayarınızdaki kodu tanıyıp analiz edecek kadar akıllıdır ve hatta grafiklere bakıp gerçek zamanlı geri bildirim ve bilgi sağlayabilir.
Özellikle GPT 4o’nun gerçek zamanlı çeviri aracından etkilendim. Bir konuşmayı İngilizceden İtalyancaya çevirip çeviremeyeceği sorulduğunda “Mükemmel!” dedi. ve işe koyuldum. Asistan süreç boyunca doğru ve arkadaş canlısıydı ve bunun harika bir seyahat aracı olduğunu görebiliyordum.
Son olarak OpenAI, GPT-4o’nun yalnızca telefonunuzun ön kamerasından selfie’nize bakarak duyguyu nasıl tespit edebildiğini gösterdi. Kişinin gülümsediğini biliyordu ve hatta “İyi hislerinizin nedenini paylaşmak ister misiniz?” diye sordu.
Bu, ChatGPT-4o’nun yapabileceklerinin yalnızca ilk örneğidir ve halihazırda Siri, Google Asistan/Gemini ve Alexa’dan çok daha akıllı ve çok yönlüdür. Apple’ın Siri 2.0 üzerinde çalıştığı ve Google I/O’nun yarın yayınlanacağı bildirildiğinden, baskı resmi olarak artıyor.
ChatGPT-4o önümüzdeki haftalarda kullanıma sunulacak ve denemek için sabırsızlanıyoruz.