Yapay zeka geliştiricileri bir süredir dijital kişisel asistan sorununu çözmeye çalışıyor, akıllı, etkileşimi kolay ve her zaman hazır bir hizmet sunuyor. Bu hafta başında Made by Google’da duyurulan Gemini Live, Google’ın bunu yapmaya yönelik yeni girişimi, bu yüzden bu yapay zekaya ne kadar yakın olduğunu görmek için 24 saatlik bir deneme süresi verdim.
Yemek pişirirken zamanlayıcı ayarlamalarını istemenin ötesinde AI asistanlarıyla doğrudan sohbet etmeye alışkın olmasam da, Gemini gibi biriyle açık uçlu bir sohbetin faydasının ne olabileceğini görmek istedim. Ve bu test gününden sonra, şu anda verdiği bazı cevaplara daha az inansam bile, en azından bu şekilde AI ile konuşmanın değerine güveniyorum.
Gemini Live ile yaptığım deneyler onun yeteneklerinin resmi bir testi olmaktan uzak olsa da, benden aldığı soruların genişliği bize neyi iyi yaptığı ve neyi iyi yapmadığı konusunda iyi bir izlenim veriyor. Bu yüzden Gemini Live’ın Gemini paketine iyi bir ekleme olacağı ve belki de bazı ücretsiz kullanıcıların ayda 20 dolara Gemini Advanced’in ücretli kullanıcıları olmaları için yeterince büyük bir neden olacağı konusunda değerlendirmeme güveniyorum. Henüz tüm hedeflerine ulaşmasa bile.
Perşembe Öğleden Sonra — Kurulum
Gemini Live, Gemini Advanced aboneliğinin bir parçası olarak geliyor, ancak ben yazarken kullanıma sunuluyor olsa da henüz tüm kullanıcılar için kullanılabilir değil. Neyse ki denemek için bir Google Pixel 9 Pro XL’im vardı. Telefon hakkında daha fazla bilgi edinmek istiyorsanız, burada yalnızca Gemini Live’a odaklanacağımız için Google Pixel 9 Pro ve Pro XL uygulamalı incelememize göz atabilirsiniz.
Bir diğer sorun da şu anda Gemini dilinizi kullanmak için ABD İngilizcesi’ne ayarlamanız gerekmesi. Neyse ki, bunu yaptıktan sonra bile, Gemini Sohbeti için sunulan on ses arasından “Capella” adlı bir İngiliz sesi seçebildim. Hepsi oldukça doğal geliyor, sadece farklı coşku ve ses perdesi seviyeleri var. Soru sormaya başladığınızda bile, özellikle kötü bir telaffuz hatası veya garip bir şekilde ifade edilmiş bir cümle almak nadirdir.
Perşembe akşamı — Eve dönüş
Her şey ayarlandıktan sonra, Gemini Chat ile ilk büyük etkileşimim eve giden yolu sormak oldu. Gemini Live, tercih ettiğim ulaşım yöntemini söyledikten ve aralarında gitmek istediğim istasyonları onayladıktan sonra, başlangıçta ne bulduğunu söylemedi. Uzun bir bekleyişten sonra, bulduğu şeyi bana söylemesini istedim ve bana rotayı tarif etti.
Muhtemelen rotayı eve götürmüş olurdum. Ancak, en sorunsuz yolculuklardan biri olmazdı. Gemini tren hatlarından birini ve istasyonlardan birini yanlış tanımladı, değişikliklerimden birinin teknik olarak iki istasyon arasında yürümeyi gerektireceğini belirtmeyi ihmal etti ve sonra tamamen sıfırdan bir tren icat etmiş gibi göründü. Bu çok garip çünkü Gemini, bilgi için Transport for London web sitesini kontrol ettiğini iddia etti.
Bu, Gemini Live’dan ziyade altta yatan AI modeliyle ilgili bir sorundur, ancak otoriter bir sese sahip olmak (üstelik İngiliz aksanıyla) bir rotanın Londra toplu taşımasına daha az aşina olan birinin çok kaybolmasına yol açabileceğini düşündürüyor. Bu tür şeyler için Google Haritalar’a bağlı kalmanız daha iyi gibi görünüyor.
Cuma sabahı — Haber brifingi
Ertesi gün, işe hazırlanırken Gemini’den günün son dakika haberlerini bana aktarmasını istedim. Tek bir komutla, Good Morning Britain ve This Morning’daki değişen sunucular hakkında çok şey anlatabildi, ayrıca Leicester Meydanı’ndaki son bıçaklama olayına dair kısa bir gönderme yaptı. Ancak teknoloji haberleri istediğimde işler daha da garipleşti.
Google Gemini başlangıçta Microsoft’un Surface Duo 3’ü duyurduğunu söyledi – henüz doğrulanmamış ve hatta birkaç aydır iptal edildiğine dair söylentiler dolaşan bir cihaz. PS5 Slim gerçek, ancak geçen sonbaharda çıktı ve son yorumunda geçen ayki Crowdstrike kesintisine atıfta bulunduğunu varsayabiliriz
Daha sonra Gemini Live’dan iPhone söylentilerine odaklanmasını istedim, ancak başlangıçta verdiği yanıtların hepsi şu anda mevcut olan iPhone 15 serisiyle ilgiliydi. Daha fazla teşvikle, bazı iPhone 16 kamera söylentilerini anlattı, ancak çok ayrıntılı değildi.
Cuma sabah ortası — Bira yapım rehberi
Birkaç saatlik çalışmanın ardından kahve molası zamanı gelmişti, bu yüzden Gemini Live’dan V60 pourover demleme konusunda bana rehberlik etmesini istedim.
Yapay zekadan adım adım talimatlar almayı umuyordum, ancak buradaki sorun Gemini Live’ı adım adım yanıtlar vermeye zorlamak için sürekli olarak uyarmanız veya kesintiye uğratmanız gerektiğidir. Ancak, başlangıçta istemlerimi yanlış duyduğunu gösteren transkripte rağmen, konuşmayı geciktirmeyi başardı ve ikna edici yanıtlar sundu.
Gemini bilgi açısından karma bir paketti. Suyu kaynatmadan önce filtrelemek gibi meraklı seviyesinde ipuçları verdi. Genel tarif, basit olmasına rağmen içilebilir bir fincanla sonuçlandı. Ancak Gemini Live ayrıca bana demleme yaparken tipik bir ölçüm olmayan gram veya ons yerine yemek kaşığı cinsinden önerilen kahve ağırlığını verdi. Ancak ekstra bir uyarıyla gram miktarı alabildim.
Cuma öğle yemeği — dövüş konuşması
Öğle yemeğinde biraz boş vaktim varken, şu anda en çok oynadığım oyun olan Street Fighter 6 hakkında Gemini Live ile kısa bir sohbet gerçekleştirdim. Bu yılın SF6 için Evo 2024 şampiyonunu ve rakibini doğru bir şekilde adlandırdı, ancak yine de çok fazla ilk ayrıntı vermedi.
Konuşmayı antrenman tavsiyesine taşıdım (belirli hareketlere aşırı güvenme eğilimindeyim), burada bir maçta yaklaşımımı nasıl yeniden düşünebileceğime dair bazı öneriler aldım. Rakibiniz size ateş topları attığında söylemesi yapmasından kolay, ama yine de geçerli bir tavsiyeydi.
Ayrıca yüz yüze buluşmaların nerede bulunabileceğine dair biraz rehberlik almaya çalıştım, ancak bu pek işe yaramadı. Ayrıntılar için resmi web sitesini kontrol etmeye çalıştı, ancak Capcom’un resmi turnuvaları dışında hiçbir şey olmadığını gördü. Daha sonra benim için yakındaki bir Facebook grubu buldu, ancak daha sonra transkriptte bana erişim için bir bağlantı veremedi.
Cuma öğleden sonra — yazma tavsiyeleri
Gemini için son bir görev olarak metaya geçmeye karar verdim ve hayır, Llama 3’ten bahsetmiyoruz. Bu makalenin girişini taslak olarak hazırlamamda bana yardım etmesini istedim.
Gemini’nin önceki yanıtlarımda bana fazla ayrıntı vermemesinin ardından, Gemini’nin belirli ifadeler önermeye ne kadar daha istekli olduğuna şaşırdım. Daha fazla bilgi parçası eklemesini veya açısını değiştirmesini istediğimde, mantıklı şekillerde yanıt verdi. Ve Google’ın Made by Google demosu sırasında gururla belirttiği gibi, Gemini Live kesintilerle başa çıkabiliyor ve yanıtlarını anında ayarlayabiliyor.
Gemini Live’ın hissettiği en iyi şey buydu, çünkü bir fikri yüksek sesle yinelemek, telefonunuzda parlayan bir dalga formuna konuşurken bile tamamen doğal hissettiriyor. Sonunda bu makalenin girişini sıfırdan yazdım. Ancak geriye doğru kaydırıp bana verdiği şeyle karşılaştırırsanız muhtemelen son önerisinin yankılarını görebilirsiniz.
Google Gemini Live: Son düşünceler
Bu makaleden Gemini Live’ı pek beğenmediğimi düşünebilirsiniz, ancak bu pek de doğru değil. Eleştirilerimin en kötüsü, onu çalıştıran Gemini Advanced modeline yönelikti, çünkü test senaryolarının birçoğunda aradığı şeyi yanlış anlamış gibi görünüyordu. Komik bir şekilde, yakın zamanda gerçekleştirdiğimiz Gemini ile Gemini Advanced arasındaki bir karşılaşma, temel Gemini’ye bağlı kalmamın daha iyi olabileceğini gösteriyor.
Bu arada, Gemini Live kendi başına çok etkilendi. Bir sohbet robotuyla sürekli bir sohbet sürdürebilmek, eğer spesifik olmaya ve yoldan çıkarsa müdahale etmeye istekli olmanız koşuluyla, metin veya resimli istemlerle etkileşime girmekten çok daha iyi bir yol gibi görünüyor. Dijital asistanlara düzenli olarak takip soruları sorabilirsiniz, ancak yine de Gemini Live’ın kanıtladığı kadar sorunsuz değil. Ve bu sorunsuzluk, soruları yanıtlamanıza ve sadece eller serbest değil, gözler serbestken rehberlik sağlamanıza yardımcı olarak pratik olmasını sağlıyor ve siz ve sohbet robotu konuşurken başka bir şeye odaklanmanızı sağlıyor.
Bunun yaklaşan ChatGPT Voice ile nasıl karşılaştırılacağına dair büyük soru hala ortada, özellikle de Gemini Live yanıt vermeden önce konuşmayı metin olarak yorumlamaya dayanırken ChatGPT Voice konuşmayı doğrudan işleyebildiğinden. Ancak her zamanki AI uyarılarına rağmen, Google’ın dijital kişisel asistan rüyasını takip etmede doğru yolda olduğu hissediliyor.