Google Glass’ın Google I/O 2024’te küçük bir geri dönüş yapmasını beklemiyordum ama Project Astra sayesinde oldu.
Bu, Google’ın, Gemini çok modlu yapay zeka tarafından desteklenen, video ve konuşma girdilerini anlamlandırabilen ve bir kişinin baktığı şeye akıllıca tepki verebilen ve bununla ilgili soruları yanıtlayabilen yeni yapay zeka aracıları prototipine verdiği addır.
“Günlük yaşamda gerçekten yardımcı olabilecek” “evrensel yapay zeka” olarak tanımlanan Project Astra, proaktif, öğretilebilir ve doğal dili anlayabilecek şekilde tasarlandı. Google, bir videoda bunu, üzerinde Astra AI’nın çalıştığı Pixel 8 Pro’ya benzeyen bir cihaz kullanan bir kişiyle gösterdi.
Kişi, telefonun kamerasını odaya doğrultarak Astra’dan “ses çıkaran bir şey gördüğünde bana söyle” diye sorabildi ve yapay zeka, kameranın vizöründe görebileceği bir hoparlörü işaretledi. Oradan kişi, konuşmacının belirli bir bölümünün ne olduğunu sorabildi ve yapay zeka, söz konusu parçanın bir tweeter olduğunu ve yüksek frekansları yönettiğini yanıtladı.
Ancak Astra çok daha fazlasını yapıyor: Bir monitördeki kodu tanımlayabilir ve ne yaptığını açıklayabilir, bir kişinin şehirde nerede olduğunu çözebilir ve o bölgenin tanımını sağlayabilir. Hatta terfi ettirildiğinde, biraz Dr Zeus’a benzeyen bir tarzda, bir dizi boya kaleminin etrafında aliteratif bir cümle bile oluşturabilir.
Yapay zeka, gözlüğü en son nerede gördüğünü hatırladığı için, kullanıcının gözlüğü nerede bıraktığını bile hatırlayabiliyor. AI, gördüğü şeyin video karelerini kodlamak, bu videoyu konuşma girdileriyle birleştirmek ve hepsini olayların zaman çizelgesinde bir araya getirmek, bu bilgiyi daha sonra hızlı bir şekilde geri çağırabilmek için önbelleğe almak üzere tasarlandığı için ikincisini yapabildi.
Daha sonra Google Glass ‘akıllı gözlük’ takan bir kişiye bakan Astra, kişinin beyaz tahta üzerindeki bir sistemin şemasına baktığını gördü ve bunlar hakkında sorulduğunda optimizasyonların nerede yapılabileceğini anladı.
Bu tür yetenekler, Glass’ın birkaç yıl önce olduğu gibi biraz ürkütücü ve tartışmasız kötü bir cihaz yerine, aniden gerçekten kullanışlı görünmesine neden oldu; belki bundan sonra Google’ın akıllı gözlük arenasına döndüğünü görebiliriz.
Project Astra tüm bunları, basit bir ifadeyle birden fazla kaynaktan gelen verileri ve girdileri işleyebilen sinir ağı modellerinin bir karışımı olan multimodal yapay zekanın kullanılması sayesinde yapabiliyor; Kameralardan ve mikrofonlardan gelen bilgileri yapay zekanın halihazırda eğitim aldığı bilgilerle karıştırmayı düşünün.
Google, Project Astra’nın ne zaman ürünlere, hatta geliştiricilerin eline geçeceğini söylemedi, ancak Google’ın DeepMind CEO’su Demis Hassabis şunları söyledi: “Bu yeteneklerin bir kısmı, Gemini uygulaması gibi Google ürünlerine bu yılın sonlarında gelecek. ” Bu, bu yılın sonlarında gelmesini beklediğimiz Google Pixel 9 anlamına gelmezse çok şaşırırım.
Şimdi, Project Astra’nın çok şık bir videoyla gösterildiğini ve bu tür yerleşik yapay zeka ajanlarının gerçekliğinin, gecikme sorunu yaşayabileceklerini akılda tutmakta fayda var. Ancak bu, Google’ın gerçekten yararlı yapay zeka araçlarını gelecekteki ürünlerine nasıl entegre edeceğine dair umut verici bir bakış.