OpenAI, önümüzdeki birkaç hafta içinde şirketin geliştirici ve tüketiciye yönelik ürünlerinde “yinelemeli olarak” kullanıma sunulacak olan, GPT-4o adı verilen yeni bir amiral gemisi üretken yapay zeka modelini piyasaya sürüyor. (GPT-4’teki “o”, “omni” anlamına gelir.)

OpenAI CTO’su Muri Murati, GPT-4o’nun “GPT-4 düzeyinde” zeka sağladığını ancak GPT-4’ün metin ve görselin yanı sıra ses yeteneklerini de geliştirdiğini söyledi.

OpenAI ofislerinde yapılan açılış sunumu sırasında Murati, “GPT-4o’nun ses, metin ve görüntü ile ilgili nedenleri” dedi. “Ve bu inanılmaz derecede önemli çünkü kendimiz ve makineler arasındaki etkileşimin geleceğine bakıyoruz.”

OpenAI’nin önceki önde gelen modeli, GPT-4’ün geliştirilmiş bir sürümü olan GPT-4 Turbo, hem görsellerin hem de metnin bir kombinasyonuyla eğitildi ve görsellerden metin çıkarmak ve hatta bu görsellerin içeriğini tanımlamak gibi görevleri gerçekleştirmek için görselleri ve metni analiz edebiliyordu. . Ancak GPT-4o karışıma konuşmayı da ekliyor.

Bu somut olarak neyi mümkün kılıyor? Çeşitli şeyler.

GPT-4o, ChatGPT deneyimini büyük ölçüde geliştirir; ChatGPT, OpenAI’nin viral yapay zeka destekli sohbet robotudur. ChatGPT uzun süredir, metinden konuşmaya modeli kullanarak ChatGPT’deki metni yazıya döken bir ses modu sunuyor. Ancak GPT-4o bunu daha da güçlendirerek kullanıcıların ChatGPT ile daha çok bir asistan gibi etkileşime girmesine olanak tanıyor.

Örneğin, kullanıcılar GPT-4o tarafından desteklenen ChatGPT’ye bir soru sorabilir ve yanıt verirken ChatGPT’yi kesebilir. OpenAI, modelin “gerçek zamanlı” yanıt verme yeteneği sağladığını ve hatta kullanıcının sesindeki duyguyu yakalayıp “farklı duygusal tarzlarda” ses üretebildiğini söylüyor.

GPT-4o, ChatGPT’nin görüş yeteneklerini de geliştirir. Bir fotoğraf veya bir masaüstü ekranı verildiğinde, ChatGPT artık “Bu yazılım kodunda neler oluyor” gibi “Bu kişi hangi marka gömlek giyiyor?” gibi ilgili soruları hızlı bir şekilde yanıtlayabiliyor.

“Biliyoruz ki bu modeller [are getting] giderek daha karmaşık hale geliyor, ancak etkileşim deneyiminin aslında daha doğal, kolay olmasını ve sizin için kullanıcı arayüzüne hiç odaklanmamanızı, sadece işbirliğine odaklanmanızı istiyoruz. [GPTs]” dedi Murat.

OpenAI, GPT-4o’nun 50 farklı dilde gelişmiş performansla daha çok dilli olduğunu iddia ediyor. OpenAI’nin API’sinde GPT-4o, GPT-4’ten (özellikle GPT-4 Turbo) iki kat daha hızlıdır, yarı fiyatınadır ve daha yüksek hız limitlerine sahiptir.

Diğer yandan OpenAI, ChatGPT’nin masaüstü sürümünü ve yenilenmiş bir kullanıcı arayüzünü yayınlıyor.

OpenAI'nin Bahar Etkinliği hakkında daha fazlasını TechCrunch'ta okuyun



genel-24