Google I/O’dan bir gün önce Google, bir tweet gönderdi Metin yerine video girişi kullanan AI Gemini sohbet robotunun konuşma versiyonunun bir prototipini uygulamalı olarak gösteriyor. Ekip yarınki etkinlik için sahneyi hazırlamakla meşgulken kaydedilen Gemini’ye şu soru soruldu: “Sizce burada ne oluyor?” Oldukça etkileyici bir şekilde Gemini şöyle yanıt veriyor: “İnsanlar büyük bir etkinliğe, belki de bir konferansa veya sunuma hazırlanıyor gibi görünüyor.”
Gemini daha sonra kullanıcının özellikle dikkatini çeken bir şey olup olmadığını sorar. Şöyle yanıt veriyor: “Evet, ekrandaki o büyük, güzel harfler. Bunlar ne anlama geliyor?” Yapay zeka sohbet robotundan gelen yanıt: “Bu harfler, Google tarafından düzenlenen bir geliştirici konferansı olan Google I/O’yu temsil ediyor. Hiç Google I/O’ya katıldınız mı?” Kullanıcı şöyle yanıt verir: “Hayır. Bu benim ilkim. Duymaktan gerçekten heyecan duyacağınız şey nedir?” Gemini şöyle yanıtlıyor: “Yapay zekadaki yeni gelişmeleri ve bunların insanlara günlük yaşamlarında nasıl yardımcı olabileceklerini öğrenmek beni her zaman heyecanlandırıyor.”
Bir gün daha #GoogleIO! Biz hissediyoruz. Yapay zeka, Arama ve daha fazlası hakkında en son haberler için yarın görüşürüz. pic.twitter.com/QiS1G8GBf9
— Google (@Google) 13 Mayıs 2024
Gemini yalnızca sorulan sorulara doğru ve uygun şekilde yanıt vermekle kalmıyor, aynı zamanda video, sohbet robotunun konuşmayı sürdürme konusunda iyi bir iş çıkardığını da gösteriyor. Google muhtemelen bu videoyu bugün “X”te yayınlandıktan bir saatten az bir süre sonra yayınlamak zorunda hissetmişti; OpenAI, ChatGPT için benzer bir özelliği ücretsiz olarak “X” hesabına ait olduğunu duyurdu. OpenAI CEO’su Sam Altman.
Ses, görüntü ve metni gerçek zamanlı olarak analiz edebilen yeni amiral gemisi modelimiz GPT-4o’ya merhaba deyin: https://t.co/MYHZB79UqN
Önümüzdeki haftalarda sesli ve görüntülü olarak API ve ChatGPT’de metin ve resim girişi bugün kullanıma sunulacak. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) 13 Mayıs 2024
OpenAI, tüketicilerin GPT-4’ten daha hızlı olan ve metin, resim, video ve sesten gelen girdileri kullanacak olan GPT-4o’ya (GPT four-oh olarak telaffuz edilir) erişebileceklerini duyurdu. 5 kat daha yüksek hız limitleriyle yarı fiyatına GPT-4 Turbo’dan iki kat daha hızlıdır. Metin ve görüntü girişleri bugün API ve ChatGPT’de başlıyor; ses ve video girişleri ise önümüzdeki haftalarda kullanıma sunulacak. GPT-4o, ücretsiz kullanıcılar da dahil olmak üzere tüm kullanıcılara GPT-4 zekasını sunacak.