Referans Çözünürlüğü Nedir?

Apple’ın araştırması bir makaleye dahil edildi Arxiv.org’da yayınlandı “Referans Çözünürlüğü”ne bakar. Birine göre saygın rehberReferans çözünürlüğü, bir bilgisayarın (AI) “Bir ifade tarafından hangi nesneye atıfta bulunulduğunu bulmak, böylece yavaş yavaş nesnelerin özellikleri ve evrimiyle birlikte bir temsilini oluşturmak” zorunda olduğu sorunu ifade etmenin bir yoludur.

Başka bir deyişle, bilgisayar, “onlar” veya “bunlar” gibi sözcükler kullandığımızda ve konuştuğumuz kişinin bağlamsal olarak ne söylemeye çalıştığımızı anladığında, insan iletişimi ve anlayışı kadar etkili olmayı hedeflemelidir.

Makale, birisinin RealLM’den yakındaki eczaneleri göstermesini isteyebileceği bir örnek sunuyor. Teknisyen listeyi sunar ve kişi “Alttakini ara” veya “Bu numarayı ara” (numara ekrandaysa) gibi belirsiz bir şey söyleyebilir. Mevcut sanal asistanlar bu durumla mücadele edebilir ancak araştırmacıların kendi teknolojisi bu görevleri yerine getiriyor. Hatta buluşlarının bazı açılardan Chat GPT4’ten “önemli ölçüde daha iyi performans gösterebileceğini”, diğer açılardan ise onun performansıyla eşleşebileceğini iddia ediyorlar.

İşler zorlaştığında Siri profesyonel oluyor

“Ekranda bulunan varlıkların bir Yüksek Lisans Programına nasıl aktarılabileceğini kritik bir şekilde gösteriyoruz. [large language model] Bu varlıkların göreceli mekansal konumlarını korurken, kullanıcının ekranını etkili bir şekilde özetleyen yeni bir metinsel temsil kullanmak” diye yazdılar.

Başka bir deyişle, belki de Apple’ın mevcut Voice Over kullanıcı arayüzü ile güçlendirilmiş, ekrandakiler üzerinde son derece etkili sözlü sözcük kontrolü bekleyebilirsiniz. VisionOS ürün serisine etkileri.

Bu, şirket WWDC 24’te geliştiricileri şaşırtmaya hazırlanırken (umarız) Apple’ın yapay zeka geliştirme ekiplerinden ortaya çıkacak pek çok bilgiden sadece bir tanesi. Bu birçok ipucu aynı zamanda uçta görev odaklı yapay zekayı destekleyen teknolojiyi de tanımlıyor; üstün görüntü zekası; Google Gemini gibi LLM sağlayıcılarıyla ortaklıklar; Xcode da dahil olmak üzere şirketin mevcut uygulamalarının genişletilmesi; ve dahası.



genel-13