Google I/O 2024’ün açılış oturumu, şirketin bir süredir üzerinde çalıştığı etkileyici yapay zeka (AI) model ve araç serisini sergilemesine olanak tanıdı. Tanıtılan özelliklerin çoğu önümüzdeki aylarda genel önizlemelere sunulacak. Ancak etkinlikte ön gösterimi yapılan en ilginç teknoloji bir süre daha burada olmayacak. Google DeepMind tarafından geliştirilen bu yeni yapay zeka asistanına Project Astra adı verildi ve gerçek zamanlı, bilgisayar görüşü tabanlı yapay zeka etkileşimini sergiliyordu.
Project Astra, mevcut sohbet robotları için son derece gelişmiş görevleri gerçekleştirebilen bir yapay zeka modelidir. Google, üretime hazır modellerini eğitmek için en büyük ve en güçlü yapay zeka modellerini kullandığı bir sistemi takip ediyor. Google DeepMind’ın kurucu ortağı ve CEO’su Demis Hassabis, şu anda eğitim aşamasında olan bir yapay zeka modelinin böyle bir örneğini vurgulayarak Project Astra’yı sergiledi. Bunu tanıtırken şunları söyledi: “Bugün, Project Astra adını verdiğimiz yapay zeka asistanlarının geleceği hakkında paylaşacağımız heyecan verici yeni gelişmeler var. Uzun zamandır günlük yaşamda gerçekten yardımcı olabilecek evrensel bir yapay zeka aracısı oluşturmak istiyorduk.”
Hassabis ayrıca şirketin bu tür yapay zeka ajanları için belirlediği bir dizi gereksinimi de sıraladı. Karmaşık ve dinamik gerçek dünya ortamını anlayıp buna yanıt vermeleri ve bağlamı geliştirip harekete geçmek için gördüklerini hatırlamaları gerekiyor. Ayrıca, yeni beceriler öğrenebilmesi ve gecikmeden sohbet edebilmesi için öğretilebilir ve kişisel olması da gerekir.
Bu açıklamayla birlikte DeepMind CEO’su, bir kullanıcının kamera uygulaması açık bir akıllı telefonu tutarken görülebildiği bir demo videosunu sergiledi. Kullanıcı bir yapay zeka ile konuşuyor ve yapay zeka anında yanıt vererek çeşitli görüş tabanlı sorguları yanıtlıyor. Yapay zeka ayrıca görsel bilgileri bağlam için kullanabildi ve üretken yetenekler gerektiren ilgili soruları yanıtlayabildi. Örneğin, kullanıcı yapay zekaya bazı boya kalemleri gösterdi ve yapay zekadan bunu aliterasyonla tanımlamasını istedi. Sohbet robotu herhangi bir gecikme olmadan şunu söylüyor: “Yaratıcı boya kalemleri neşeyle renkleniyor. Kesinlikle renkli kreasyonlar yaratıyorlar.
Ama hepsi bu değildi. Videonun ilerleyen kısımlarında kullanıcı, bazı binaların ve yolların görülebildiği pencereyi işaret ediyor. Mahalle hakkında soru sorulduğunda yapay zeka hemen doğru cevabı veriyor. Bu, yapay zeka modelinin bilgisayarlı görüntü işleme kapasitesini ve onu eğitmek için gereken devasa görsel veri kümesini gösteriyor. Ancak belki de en ilginç gösteri, yapay zekaya kullanıcının gözlüklerinin sorulmasıydı. Birkaç saniyeliğine ekranda kısa bir süre belirdiler ve çoktan ekrandan ayrılmışlardı. Ancak yapay zeka konumunu hatırlayabiliyor ve kullanıcıyı ona yönlendirebiliyor.
Project Astra’nın genel veya özel önizlemesi mevcut değildir. Google hala model üzerinde çalışıyor ve AI özelliğinin kullanım durumlarını bulması ve bunu kullanıcılara nasıl sunacağına karar vermesi gerekiyor. Bu gösteri şimdiye kadar yapay zekanın en gülünç başarısı olabilirdi, ancak OpenAI’nin bir gün önceki Bahar Güncellemesi etkinliği bu fırtınanın bir kısmını ortadan kaldırdı. OpenAI, etkinliği sırasında, yapay zekanın daha insani görünmesini sağlayan benzer yetenekleri ve duygusal sesleri sergileyen GPT-4o’yu tanıttı.