Darwin AI’nın satın alınmasından Apple’ı iddia eden son raporlara kadar Google ile çalışabilir ve diğerlerinin sunmayı planladığından daha geniş bir yelpazedeki üretken yapay zeka (genAI) araçlarını desteklemesine rağmen, şirketin kendi yapay zeka teknolojilerini yarattığı yere odaklanmayı seçtiği oldukça açık.

Bu odak alanlarından en az biri, yapay zekanın moda bir kelime haline gelmesinden bu yana şirketin yaptığı çalışmaları yansıtıyor; bu da vizyon zekasıdır.

Hayatın imaları

Bununla özellikle gördüklerini anlayabilen, bu bilgiyi bağlamsallaştırabilen, buna göre kararlar verebilen, görüşü değiştirebilen veya değiştirebilen yapay zekayı kastediyorum.

Zaten bu tür yapay zekayı kullanıyor olabilirsiniz:

  • Bir belgenin fotoğrafını her çektiğinizde Apple, metni kopyalayıp başka bir belgeye yapıştırmanıza izin verir.
  • iPhone’unuz size bir binanın kapılarının nerede olduğunu söyleyebildiğinde.
  • Görünen şeylerin açıklamalarına bağlanmak için Fotoğraflar’daki ‘I’ düğmesine dokunduğunuzda.
  • iPhone’unuz size maruz bıraktığınız bir çamaşır etiketinin anlamını söylediğinde.
  • Etrafınızdaki tabelalardaki metni çözmek için Çevir’i kullandığınızda.
  • LiDAR sensörü size bir oda haritası sağladığında.

Başka birçok örnek var. Seyahat yönünü gösteren daha iyi resimler bile olabilir.

Elektron mavileri

Apple’ın araştırmacıları yakın zamanda yayınlanan bir Beyaz kağıt Bu, yayınlandığından beri şaşkınlık ve yorum yarattı. Metin ve Görüntü Verileri için Multimodal Model olan MM1 adı verilen bir teknolojiyi tanımlar.

Bu, hem metni hem de görüntüleri kullanarak büyük dil modellerini (LLM’ler) eğitebileceği anlamına geliyor ve yapay zeka için “önemli bir ilerleme” olarak adlandırılıyor. Teknolojiyi kullanan modeller, resim yazısı ekleme, görsel soru yanıtlama ve doğal dil çıkarımı gibi görevlerde mükemmel performans gösterdi.

Sistem ayrıca bağlamsal öğrenme yetenekleri açısından da güçlü olduğunu gösterdi. Başka bir deyişle, metinlere/kelimelere ve görsellere maruz kalarak hızlı öğrenebilir, bu da teknolojinin sonunda gerçekten karmaşık, açık uçlu sorunları çözebileceği anlamına gelir. İkincisi, AI araştırması için kutsal bir kâsedir, çünkü bunu başarmak, sorunları son derece bağlamsal bir şekilde çözebilen makineler anlamına gelir.

Hepsi güzel ama burada önemli olan görsellerin kullanılması. Bu, Apple’ın son aylarda yapay görme zekasından bu şekilde yararlandığı ilk sefer değil. Geçtiğimiz ay, Keyframer animasyon aracı bozuldu ve 2023’te şirketin yapmayı planladığı şeyin bir kısmının, Vision Pro’da kullanılmak üzere gerçekçi, sürükleyici sahneler oluşturabilen yapay zeka olduğunu duyduk.

İnsanlar için otomatikleştirilmiş

Ve ikinci ürün elbette Apple’ın Üretken Görsel Yapay Zeka vizyonunun büyük kısmının, sonuçları derin olduğundan en büyük farkı yaratabileceği alandır. Vision Pro takan bir kişinin bir ortama (herhangi bir ortama) girmesini ve bu alanı keşfederken o yerin başkalarıyla da paylaşılabilecek mükemmel bir dijital kopyasını oluşturmasını nasıl mümkün kıldığını düşünün. Sorun şu ki, bu araç sadece yerin aptalca bir temsili değil; Vizyon zekasıyla donanmış olarak ortaya çıkan ortak deneyim, yalnızca Bakmak Keşfetmekte olduğunuz yer gibi, herhangi bir hatayı düzeltmek için birkaç parametre ayarıyla, bu etkili bir şekilde o alanın tamamen işleyen dijital temsili.

Bu, trafik yönetiminden bina ve tesis yönetimine kadar her türlü durumda faydalıdır, ancak mekanların gerçeğe yakın, akıllı ve akıllı temsillerini oluşturma kapasitesi aynı zamanda mimari ve tasarıma da uzanır. Ve tabii ki sağlık açısından da belirgin sonuçları var.

Bu fikirlerin hiçbiri benim belirttiğim şekilde işe yaramayabilir, ancak Vision Pro’nun birden fazla endüstri için dijital ikizler oluşturmadaki yerinin kesinleşeceğinden %100 eminim.

Herkes acıyor

Ancak son derece görselliğe sahip yeni işletim sistemlerinin (visionOS) derin bağlamsal anlayış ve yanıt verebilen son derece görsel bir yapay zeka ile birleşimi, yalnızca ünlü Tom Cruise filmine yetişen bir şey değil. Azınlık Raporu.

Bu, o filmde tavsiyelerde bulunan gelecek bilimcilerin vizyonlarının ötesine geçen, gerçek zamanlı olarak gerçekleşmek üzere olan bir teknoloji dağıtımıdır.

Artık tüm sektörün buna şaşmamalı Apple’ın yönünde ilerlemek istiyor – şirketin oraya en hızlı şekilde ulaştığını görmek acı verici olmalı. Ama bazen herkes acı çeker.

Lütfen beni takip edin Mastodonveya bana katılın AppleHolic’in barı ve ızgarası Ve Apple Tartışmaları MeWe’deki gruplar.

Telif Hakkı © 2024 IDG Communications, Inc.



genel-13