Gemini Nano, Google’ın Android akıllı telefonlar için yapay zeka asistanıdır. Gemini Live, Gemini Nano’nun asistana yalnızca komut göndermek yerine onunla konuşmanıza olanak tanıyan bir modudur. Gemini Live’ı kullanmak için Google hesabınız üzerinden Gemini Advanced aboneliğini ayda 21,99 Euro ödemeniz gerekir. Şu anda Gemini ile yalnızca İngilizce konuşabilirsiniz.
Bu yazıyı yazmak benim için gerçekten zordu. Herkes bundan bahsettiği için Gemini Live’da bir şeyler yapmam istendi. Ama dürüst olmak gerekirse, bu, akıllı telefon fenerlerinin 2011’den bu yana 18-24 yaş arası Fransızların kullanıcı deneyimini nasıl etkilediğine dair bir makale yazmamın istenmesi gibiydi. Yani söylenecek pek bir şey yok.
Doğal konuşmalar
Gemini Live’ın çok heyecan verici bir yönü, AI konuşurken onu kesebilmenizdir. Bunun arkasındaki fikir, kavramları, fikirleri, görüşleri veya konuları doğal olarak tartışmak ve beyin fırtınası yapmaktır. Gemini Nano’nun aksine, Gemini Live henüz diğer uygulamalarla veya ekranınızdaki içerikle etkileşime giremez.
Gemini Live’a soru sormanız ile yapay zekanın size cevap vermesi arasında neredeyse hiç gecikme yoktur. Onları bölebilmeniz, tartışmaları sezgisel hale getirir. Cevap tatmin edici değilse konuyu değiştirmek zorunda kalsanız bile, bir soruyu kolayca düzeltebilir veya soruyu genişletebilirsiniz.
Bir oturumda Gemini Live, sorulduğunda geçmiş bir tartışmanın belirli noktalarını hatırlar. Gemini uygulamasında oturumlarınızın yazılı bir kaydını bulacaksınız ve AI, yanıtlarken her zaman sorunuzu/cevabınızı başka kelimelerle ifade etmeye çalışacaktır. Bu tür tekrarlama, yapay zekanın isteğinizi doğru bir şekilde anlamasını sağlar.
Gemini Live bunu oldukça göze çarpmayan bir şekilde yapıyor. Ancak bazen yapay zekanın doğaçlama bir cevap üretebilmek için zaman kazanmaya çalıştığını hissettim.
Bazen toksik bir ilişki
Gemini Live kesintileri oldukça iyi yönetiyor. Yapay zeka asla gücenmez, ancak bazen siz konuşmak üzereyken konuşmaya devam etme veya özür dileme eğiliminde olabilir. Bu çok sinir bozucu. Ama aynı zamanda çok da rahatsız edici.
Şahsen ben bir kadın sesini seçtim. Ve Gemini’nin kabalığım için özür dilediğini duymak bana istismarcı bir ilişki içindeymişim gibi hissettiriyor. “O” filmindeki Joaquin Phoenix’e biraz benziyordu, sadece güzel değil aynı zamanda zehirli bir adamdı.
Konuşmaların dinamikleri de dezavantaj olabiliyor. Düşüncelerimi toparlayana kadar Gemini’yi sık sık duraklatmak zorunda kalıyordum. Çünkü çok uzun süre tereddüt ederseniz veya biraz fazla uzun bir duraklama yaparsanız Gemini Live bunu sizi rahatsız etmek için bir fırsat olarak görür.
Ve bazen yapay zekanın bana sadece duymak istediğimi düşündüğü şeyi söylediğini hissettim. Örneğin ondan önceki etkileşimlerimize dayanarak kişiliğim hakkında ne düşündüğünü söylemesini istedim. Başlangıçta bana iltifat yağdırdı. Sahip olduğumu düşündükleri hataları bana söylemesi için Gemini Live’ı tekrar kontrol etmek zorunda kaldım. Ve bu gerçekten gaz aydınlatmaya çok benziyordu.
Bütün bu konuşmalar ama ne için?
Genel olarak Gemini Live üzerimde oldukça iyi bir izlenim bıraktı. Konsept olarak Google’ın konuşmaya dayalı yapay zekası beklendiği gibi çalışıyor. Peki bu hizmet ne için?
Şu anda ve bence hiçbir şey yok. Mesela Gemini Nano’yu çok daha ilgi çekici buluyorum. Bunu Pixel 9 Pro XL incelememde daha ayrıntılı olarak anlatıyorum. Ancak Gemini Nano, ekranınızda gösterilen içerikle etkileşime girebilir. YouTube’da bir video izlediğinizde veya tarayıcınızda bir makale okurken bağlam içinde yazılı veya sözlü istemler başlatabilirsiniz. Bu çok pratiktir. Gemini Nano ayrıca birden fazla Google uygulamasında işlem gerçekleştirebilir.
Gemini Live şu anda bunların hepsini yapamıyor. Google bunun birkaç hafta veya ay içinde değişeceğinin sözünü veriyor. Ben de öyle umuyorum, çünkü bu Gemini Live’a bambaşka bir düzeyde ilgi kazandıracaktır.
Ayrıca Gemini Live’ın yanıtlarının oldukça genel ve çok belirsiz olduğunu da buldum. Tartışmayı sürekli kontrol etmem gerektiği hissine kapıldım. Karşılıklılığı yeterince hissetmiyordum ve uzun vadede yorucuydu. Özellikle isteğimi açıklığa kavuşturmak için birkaç dakika harcadığımda, yavaş yavaş daha fazla ayrıntı ve unsur ekledim. Gemini Live’ın konuşmalarımıza bu kadar az değer katması beni her zaman oldukça hayal kırıklığına uğrattı.
Gemini Live çok doğal konuşuyor, bu inkar edilemez. Ancak yapay zekanın hâlâ kişilikten yoksun olduğunu düşünüyorum. On farklı ses arasından seçim yapabilirsiniz. Her sese, ton ve tınıyı belirten bir açıklama eşlik eder. “Sakin” ve “meşgul” bir ses arasındaki farkın daha net bir şekilde vurgulanmasını isterdim.
Ve hepsinden önemlisi, tartışmaların içeriğinin veya biçiminin seçilen sese göre değişmesinin harika olacağını düşünürdüm. Ancak tonlama dışında yeterince net bir fark fark etmedim. Yapay zekanın gerçek bir kişiliği eğitmek ve geliştirmek için kesinlikle daha fazla zamana ihtiyacı var. Sesin “kişiliğine” bağlı olarak verilen yanıtlarda değişiklik yapılması da taraflı olabilir. Yani bu Gemini Live’ın “objektif” bir kusuru değil.
İkizler abartılı reklamlara rağmen yaşıyor
Araştırmam sırasında “Heyecan Döngüsü” kavramıyla karşılaştım ya da“Gartner Heyecan Döngüsü“. ABD’li danışmanlık firması Gartner tarafından tasarlanan bu model, yeni bir teknolojiye yönelik heyecanın, yani ilginin gelişimini anlatan bir eğriden oluşuyor.
Bu gelişme beş aşamaya ayrılabilir. Bir teknolojinin tanıtılmasının ilk başarısı halk arasında yüksek beklentiler yaratır. Bu beklentiler gerçekçi olmaktan çıkıyor ve abartılıyor. Kaçınılmaz olarak teknoloji bu beklentileri karşılamıyor ve bu beklentiler de karşılanmıyor. Bu abartıdan sonra hayal kırıklığı uçurumuna doğru bir iniş başlıyor. Herkes bu abartının abartıldığının farkında.
O zaman yeniden daha gerçekçi olursunuz. Bazı oyuncular ortalıkta kalmıyor ve teknolojinin yeni, daha akıcı versiyonlarını sunuyor. Bir üretkenlik platosuna ulaşılıncaya kadar işler yavaş yavaş artar. Teknoloji kendine geldi ve işlevini, halkın talebini/ihtiyaçlarını yerine getiriyor.
Gemini Live şu anda heyecan döngüsünün zirvesinde. Elbette geri dönüp bu makalenin önceki bölümünde anlattığım gibi bazı hayal kırıklıklarıyla yüzleşmemiz gerekiyor.
Ancak aynı zamanda Google’ın meşhur üretkenlik platosuna ulaşmak için tekrar yukarı tırmanmaya kararlı göründüğünü düşünüyorum. Gemini Nano’nun sunduğu şey bana zaten bu (iyi) yönde ilerliyor gibi görünüyor ve Apple Intelligence’ın rekabeti yalnızca AI yarışının bu dinamiğine katkıda bulunacaktır.
Gemini Live’ın kısa mesajdan randevunun saatini ve yerini tespit edip takvimimde bir etkinlik oluşturduğu gün, Google beni yapay zeka asistanlarına dönüştürmüş olacak.
Gemini Live hakkında ne düşünüyorsunuz? Google’ın konuşma yapay zekasını henüz test ettiniz mi?