
Şirketin yapay zeka araştırma kanadı Google DeepMind, Project Astra’yı ilk kez bu yıl I/O’da tanıttı. Şimdi, altı aydan uzun bir sürenin ardından teknoloji devi, yapay zeka (AI) aracısındaki yeni yetenekleri ve iyileştirmeleri duyurdu. Gemini 2.0 AI modellerinden yararlanarak artık birden çok dilde konuşabiliyor, birden çok Google platformuna erişebiliyor ve gelişmiş belleğe sahip. Araç hâlâ test aşamasında ancak Mountain View merkezli teknoloji devi, Project Astra’yı Gemini uygulamasına, Gemini AI asistanına ve hatta gözlük gibi form faktörlerine getirmek için çalıştığını belirtti.
Google, Project Astra’ya Yeni Yetenekler Ekliyor
Project Astra, işlevsellik açısından OpenAI’nin görüş moduna veya Meta Ray-Ban akıllı gözlüklerine benzeyen genel amaçlı bir AI aracısıdır. Kullanıcının çevresini görmek ve görsel verileri işleyerek onlarla ilgili soruları yanıtlamak için kamera donanımıyla entegre olabiliyor. Ek olarak yapay zeka aracısı, kamera aracılığıyla aktif olarak gösterilmediğinde bile görsel bilgileri hatırlamasına olanak tanıyan sınırlı bir belleğe sahiptir.
Google DeepMind bir şekilde vurgulandı blog yazısı Mayıs ayındaki gösteriden bu yana ekip, yapay zeka aracısını geliştirmek için çalışıyor. Artık Gemini 2.0 ile Project Astra birçok yükseltme aldı. Artık birden fazla dilde ve karışık dillerde konuşabiliyor. Şirket artık aksanları ve alışılmadık kelimeleri daha iyi anladığını söyledi.
Şirket ayrıca Project Astra’da araç kullanımını da tanıttı. Artık karmaşık soruları yanıtlamak için Google Arama, Lens, Haritalar ve Gemini’dan yararlanabiliyor. Örneğin, kullanıcılar bir yer işareti gösterebilir ve yapay zeka aracısından evlerinin yolunu göstermesini isteyebilir; nesneyi tanıyabilir ve kullanıcıyı sözlü olarak eve yönlendirebilir.
Yapay zeka aracısının hafıza işlevi de yükseltildi. Mayıs ayında Project Astra yalnızca son 45 saniyeye ait görsel bilgileri tutabiliyordu; artık 10 dakikalık oturum içi belleğe genişletildi. Ek olarak, daha kişiselleştirilmiş yanıtlar sunmak için daha fazla geçmiş konuşmayı da hatırlayabilir. Son olarak Google, aracının artık insan konuşmasının gecikmesinde dili anlayabildiğini ve araçla etkileşimi daha insani hale getirdiğini iddia ediyor.

