OpenAI kısa süre önce, AI sohbet robotuyla yapılan görüşmelerde metin istemlerine ek olarak resim kullanma yeteneği de dahil olmak üzere güçlü yeni ChatGPT özelliklerini duyurdu.

Şirket sunulan örnekler:

“Seyahat ederken önemli bir yerin fotoğrafını çekin ve ne olduğu hakkında canlı sohbet yapın.bu çok ilginç. Sen ne zamanEvde olduğunuzda buzdolabınızın ve kilerinizin fotoğraflarını çekin ve ne olduğunu öğrenin.akşam yemeği için (ve adım adım tarif için takip soruları sorun). Akşam yemeğinden sonra, fotoğrafını çekerek, problem setini daire içine alarak ve ipuçlarını ikinizle paylaşarak çocuğunuzun matematik probleminde yardımcı olun.

(Şirket ayrıca mobil uygulamasının chatbot için ses girişi ve çıkışını destekleyeceğini duyurdu. Düzinelerce üçüncü taraf uygulamasının zaten izin verdiği gibi ChatGPT ile konuşabileceksiniz. OpenAI yetkilileri ayrıca ChatGPT’nin yakında etkinleştirileceğini duyurdu. Ek bilgi için Microsoft’un Bing arama motoruna erişebilirsiniz.)

OpenAI, resim istemleri vaat eden tek yapay zeka şirketi değil.

Meta’nın yeni kamera gözlükleri

Eskiden Facebook olarak bilinen şirket Meta yakın zamanda tanıtıldı kamera gözlüklerinin ikinci versiyonuile ortaklaşa oluşturulan EssilorLuxottica’nın Ray-Ban bölümü. Fiyatı 299 dolar olan ve 17 Ekim’de satışa sunulan yeni özellikler, ilk versiyona göre daha fazla ve daha iyi kamera, mikrofon ve hoparlöre sahip ve Facebook ve Instagram’da canlı yayın yapılmasını sağlıyor.

Gadget meraklıları ve sosyal etki sahibi kişiler bu özelliklerden heyecan duyuyor. Ancak asıl yükseltme yapay zekadır (AI). Gözlük şunları içerir: Qualcomm’un Güçlü yeni AR1 Gen 1 çipi, Meta Ray-Ban akıllı gözlük takan kullanıcıların yerleşik hoparlörler ve mikrofonlar aracılığıyla yapay zeka ile konuşabileceği anlamına geliyor. Ancak bu herhangi bir eski yapay zeka değil.

İlgili bir duyuruda Meta, ChatGPT alternatifini duyurdu. Meta yapay zeka Bu aynı zamanda mevcut 28 sentetik sesten herhangi biri tarafından verilen yanıtlarla sesli sohbeti de destekler. Meta, Meta AI’yi tüm sosyal platformlarına (gözlükler dahil) dahil ediyor – ve Meta AI ayrıca Microsoft’un Bing arama motorunda Llama LLM’den (LLM, Büyük Dil Modeli anlamına gelir) daha güncel bilgiler için arama yapabilecek. ) konusunda eğitim verildi.

Facebook, gelecek yıl Meta Ray-ban gözlüklerini “multimodal” hale getirecek bir yazılım güncellemesi sözü verdi. Gözlükler, Meta AI sohbet robotuyla sesli olarak etkileşim kurmak yerine, OpenAI’nin artık yaptığı gibi “resimli komutları” kabul etme yeteneği kazanacak. Ancak Meta Ray-Ban gözlükleri, bir jpg yüklemek yerine, gözlüğün içindeki yerleşik kameraları kullanarak görüntüyü yakalayacaktır.

Gözlük takarken bir binaya bakıp “Bu hangi bina?” diyebileceksiniz. ve AI size cevabı söyleyecektir. Meta ayrıca işaretlerin ve menülerin gerçek zamanlı dil çevirisinin, baktığınız ev aletinin nasıl onarılacağına ilişkin talimatların ve diğer kullanımların da sözünü verdi. Meta’nın güçlü yüz tanıma teknolojisi sayesinde gözlüklerin size kiminle konuştuğunuzu söylemesinin an meselesi olacağını umuyorum.

Başka bir deyişle Meta Ray-Bans, bu yazılım güncellemesiyle etkili bir şekilde AR gözlük haline gelecek.

AR’nin geleceği neden yapay zekadır?

Artırılmış gerçeklik (AR), dijital görüntüler, sesler ve metinler aracılığıyla fiziksel gerçeklikte gördüklerimiz hakkında ek bilgi sağlayan veya geliştiren bir teknolojidir.

Apple, Microsoft ve Magic Leap gibi şirketler, pahalı, ağır ve pil tüketen AR gözlüklerini takan kullanıcılara yüksek çözünürlüklü sanal 3D nesneleri, karakterleri ve avatarları göstermeye yönelik sistemler icat etmek için onlarca yıl (ve milyarlarca dolar) harcadı.

Teknoloji medyasında veya teknoloji endüstrisinde AR hakkında düşündüğümüzde veya konuştuğumuzda, AR gözlüklerimiz aracılığıyla gerçek dünyaya ne tür holografik görüntülerin üst üste bindirildiğini görebileceğimize odaklanma eğilimindeyiz. Eller serbest Pokémon Go’yu veya Google Glass’ın çok daha iyi versiyonlarını hayal ediyoruz.

Ancak geçen yılın sonlarında üretken AI/LLM tabanlı sohbet robotu devriminin gerçekleşmesinden bu yana, AR deneyimini oluşturan tüm parçalar arasında holografik dijital sanal nesnelerin en az önemli olduğu giderek daha açık hale geldi.

Gözlük gereklidir. Android telefonlar ve iPhone’lar yıllardır “artırılmış gerçeklik” özelliklerine sahip ve kimsenin umrunda değil çünkü telefonunuza bakmak, dünyayı eller serbest olarak gözlüklerle görmekle karşılaştırılamaz.

Kameralar ve diğer sensörler gereklidir. Cihazınızın gerçekliği algılama yolu yoksa gerçekliği artırmak imkansızdır.

Yapay zeka gereklidir. Görüş alanımızdaki rastgele insanları, nesneleri ve etkinlikleri yorumlamak ve anlamlandırmak için yapay zekaya ihtiyacımız var.

İki yönlü ses gereklidir. Kullanıcının AR üzerinde kontrol sağlamak için yazılımı sorgulamak ve yazılımla etkileşime geçmek için eller serbest bir yola ihtiyacı var.

Ve ortaya çıktı ki, sanal ekran, sanal veriler ve sanal nesnelere sahip olmak güzel olsa da gerekli değil.

Eskiden en önemli olduğunu düşündüğümüz teknoloji artık en az önemli hale geliyor. AR’den bahsederken “çıktının” görsel kalitesini gereğinden fazla vurguladık. Konferans katılımcıları, demo izleyicileri ve ilk müşterilerin gözleri, etrafta dolaşan 3D karakterler ve diğer anlamsız içerik parçaları karşısında şaşkına döndü.

İçeriğin kalitesi ve artırılan gerçeklikle ilişkisi ne olacak? AR’yi gerçekten güçlü kılan şey, cihazlarımızın önümüzde ne olduğunu net bir şekilde anlayarak başlaması ve ardından bize bu gerçeklik hakkında bilgi, içgörü ve tavsiye sunabilmesidir.

Yapay zekanın genel amaçlı AR’nin en vazgeçilmez bileşeni olduğu ortaya çıktı.

Bu, görsellerin her şey olduğu ve yapay zekanın gerekli olmadığı sanal gerçekliğin tam tersidir.

Bugün Tech’ten Keith Shaw, Jigspace’in kurucu ortağı ve AR/VR alanında endüstri lideri Zac Duff ile bu teknolojiyi başlatma umutları hakkında sohbet ediyor.

Zuckerberg, Meta Ray-Ban duyurusunda şunları söyledi: “Akıllı gözlükler, yapay zeka asistanlarının gördüklerinizi görmesine olanak tanıyan ideal form faktörüdür.”gördüklerini görüyor ve duyuyorsunyeniden duyuyorum.”

O haklı.

Meta’nın AR’nin geleceğine hakim olup olmayacağı hiç de belli değil. Ancak açık olan şey, yapay zekanın AR’nin geleceği olduğu ve AR’nin de yapay zekanın geleceği olduğudur. OpenAI, Microsoft ve Google da dahil olmak üzere tüm önde gelen yapay zeka şirketlerinin hızla Meta Ray-Ban benzeri gözlükleri piyasaya sürmeleri beni şaşırtmaz. Çünkü konuşmak yazmaktan, göstermek konuşmaktan daha iyidir.

Apple hakkındaki sızıntılar, patentler ve raporlar, şirketin devasa, hantal, yalnızca iç mekanlarda kullanılabilen Vision Pro gemilerinden çok sonra, yıllar sonra gönderilecek hafif, günlük kullanım için AR gözlükleri üzerinde çalıştığını gösteriyor. Ama bana öyle geliyor ki Apple, tıpkı Amazon Echo ev sanal asistan cihazında olduğu gibi, yine vapuru kaçıracak. Amazon’un Echo’yu göndermesinden sonra Apple’ın Apple HomePod’u göndermesi iki yıldan fazla sürdü. Apple’ın tüm gün süren gözlüklerini geciktiren şey, sesli konuşmalara ve AI kamera girişine odaklanmak yerine, kullanıcıya lenslerde ilgi çekici görsel veriler sunmaya takılıp kalmasıdır.

Kimse geçen haftaki duyuruların sonuçlarını tam olarak anlamış gibi görünmüyor, bu yüzden hemen çıkıp şunu söyleyeceğim: Meta Ray-Ban akıllı gözlük duyurusu, yeni AI destekli AR gözlük platformuna hakim olma yarışının gerçekten başladığı anlamına geliyor. Bu, hem tüketiciler hem de işletmeler için çok büyük olacak tamamen yeni bir bilgi işlem platformudur. Tekrar söyleyeceğim: AR’nin geleceği yapay zekadır. Ve yapay zekanın geleceği AR’dir.

Telif Hakkı © 2023 IDG Communications, Inc.



genel-13