Google, Gemini’nin yenilikçi gerçek zamanlı AI video işlevselliklerinin konuşlandırılmasına başladı ve platformun bir kullanıcının cihaz ekranından veya akıllı telefonun kamerasından görsel girdiyi yorumlamasını ve bağlamsal cevaplar sağlamasını sağladı. Bu dağıtımın teyidi Bu yeteneklere güç veren temel teknoloji olan “Project Astra” nın ilk demolarından yaklaşık bir yıl sonra geliyor. Google G/Ç 2024 sırasında sergilendi. Reddit kullanıcısıBaşlangıçta bu özelliğin görünümünü bir Xiaomi ahizesinde gösterdi. Bu kullanıcı daha sonra Gemini’nin ekran içeriğini analiz etme yeteneğini sergileyen bir video paylaştı. Bu ekran okuma işlevi, Google’ın Mart başında açıkladığı iki temel özellikten biridir.

Tabii ki, bu, Project Astra’nın geçen yıl demo edildiği ve yukarıdaki videoda görülebileceği gibi her bir yönünü kapsıyor gibi görünüyor. Tam demo, kamera anlarınız aracılığıyla gördüğü öğelerin anılarını koruduğunu ve daha sonra nerede gördüğünü söylediğini, hatta daire içine alınmış alanda daha spesifik bilgiler sormak için öğelerden yararlanma seçeneği sundu.
Ancak, bana göre, geçen yıl gösterildiğimiz bu AI asistanı gelecekten çok uzak değiliz. İkizler’in özellik setinde ilerleme oranı çok umut verici ve Google’ın bu yılki Google I/O konferansında bunu nasıl üstleneceğini görmek için çok heyecanlıyım.

