Yapay zeka gözlükleri + çok modlu yapay zeka = devasa yeni bir endüstri – Computerworld

Byteknomers

May 20, 2024 #Bir, #çok, #Computerworld, #devasa, #endüstri, #gözlükleri, #Modlu, #Yapay, #Yeni, #Zeka

Çok modlu yapay zekada videonun güçlü rolü

Multimodal AI aynı anda metin, ses, fotoğraf ve videoyu birleştirir. (Açık olmak gerekirse, “metin” bilgisini doğrudan ses, fotoğraf veya videodan alabilir. Gördüğü kelimeleri “okuyabilir” veya çıkarabilir, ardından bu metni karışıma girebilir.)

Videolu çok modlu yapay zeka, kullanıcı-bilgisayar arayüzünü insan deneyimine büyük ölçüde yaklaştırıyor. Yapay zeka düşünemez veya anlayamasa da, video ve diğer girdilerden yararlanabilmek (aynı zamanda multimodal olan) insanları fiziksel çevre veya farkındalık konusu hakkında aynı fikirde bir araya getirir.

Örneğin, Google I/O açılış konuşması sırasında, Google Deepmind genel merkezindeki mühendisler, (OpenAI’nin yeni modelinde olduğu gibi) bilgisayar ekranınızdakileri okuyabilen, görebilen ve “izleyebilen” Astra projesiyle birlikte bunu izliyorlardı. Yayınladılar bu video X’te, bir mühendisin ekrandaki video hakkında AI ile sohbet ettiğini gösteriyor.

Ortaya çıkan bir başka eğlenceli demo, GPT-4o’yu çalışırken gösterdi. İçinde o videoOpenAI mühendislerinden biri, GPT-4o çalıştıran bir akıllı telefon ve onun kamerasını kullanarak, başka bir GPT-4o akıllı telefondaki başka bir örneğin yorumlarına ve sorularına dayanarak gördüklerini açıklıyor.

Her iki demoda da telefonlar başka bir kişinin yapabileceği şeyi yapıyor; bir kişiyle birlikte dolaşmak ve onun fiziksel dünyadaki nesneler, insanlar ve bilgiler hakkındaki sorularını yanıtlamak.

Reklamverenler, reklamlarının duygusal etkisini kaydetmenin bir yolu olarak çok modlu yapay zekaya sahip videolara bakıyor. “Duygular, gerçek dünyayı bir cep telefonu kamerasının merceğinden işleyebilen Project Astra gibi teknoloji aracılığıyla ortaya çıkıyor. Gördüğü görüntüleri ve bilgileri sürekli olarak işler ve nesnenin yanından geçtikten sonra bile yanıt verebilir.” Laurie Sullivan’ın MediaPost hakkında bir görüş yazısı.

genel-13

By teknomers

Benzer İçerikler

Liste

Yapay zeka gözlükleri + çok modlu yapay zeka = devasa yeni bir endüstri – Computerworld

Byteknomers

Çok modlu yapay zekada videonun güçlü rolü

By teknomers

Benzer İçerikler

Yeni Kaptan Amerika: Cesur Yeni Dünya fragmanında çok daha fazla Kızıl Hulk var

Android ve iOS için Google Fotoğraflar Uygulaması, Gelen Etkinliği Görüntülemek için Yeni Güncellemeler Sayfası Alıyor

Chegg, ChatGPT’nin Hisselerini %99 Düşürdükten Sonra Son Ayaklarını Sürüyor

Sony Başkanı, PS5 Pro Fiyatlandırmasının Satışlar Üzerinde Olumsuz Bir Etkisi Olmadığını, “Sert Kullanıcıların” Hedef Kitlesi Olduğunu Söyledi

Andor 2. Sezonun Yayın Tarihi Var Görünüyor!

Skydance Games’in Behemoth’u 5 Aralık’ta PCVR’de Diğer Tüm Platformlarla Birlikte Çıkıyor; Fortnite Deneyimi Artık Oynanabilir

Minecraft’ta Tayga Biyomları Nasıl Bulunur?

T-Mobile kurumsal mağazasındaki moralin “korkunç” olduğunu mağazanın müdürü özel konuşmada bize anlattı

Tehlikeli bir kusuru düzeltmek için Pixel kullanıcılarının Kasım ayı güvenlik güncellemesini en kısa sürede yüklemeleri gerekiyor

Herkese açık Wi-Fi giriş sayfaları bu değişiklikle yakında yükseltilebilir

Google, yapay zeka destekli yeni video oluşturma uygulamasını kullanıma sunuyor

NASA astronotları uzayda neredeyse sekiz ay geçirdikten sonra hangisinin hastalandığını söylemeyecek

İki fırçalamanın ardından SpaceX Cape Canaveral fırlatmasını iptal etti

Samanyolu’ndaki hidrojen bulutlarını tespit etmek için ev radyo teleskopu nasıl yapılır

Güçlü yeni ABD-Hindistan uydusu Dünya’nın değişen yüzeyini izleyecek

İlginizi Çekebilir

Yeni Kaptan Amerika: Cesur Yeni Dünya fragmanında çok daha fazla Kızıl Hulk var

Android ve iOS için Google Fotoğraflar Uygulaması, Gelen Etkinliği Görüntülemek için Yeni Güncellemeler Sayfası Alıyor

Chegg, ChatGPT’nin Hisselerini %99 Düşürdükten Sonra Son Ayaklarını Sürüyor

Başlangıç fiyatlarına sahip YouTube Music Premium’u ilk benimseyen bazı kullanıcılar yakında fiyat artışı görecek