
Google, Gemini 2.0 Flash’ın en sevdiğiniz AI chatbot olması gerektiğini bilmenizi istiyor. Model, selefi Gemini 1.5 Flash’tan daha fazla hız, daha büyük beyin ve daha sağduyulu. Gemini Flash 2.0’ı ChatGPT’ye karşı açtıktan sonra, Google’ın yeni favori modelinin büyük kardeşiyle nasıl karşılaştırıldığını görmeye karar verdim.
Daha önceki eşleşmede olduğu gibi, düelloyu kendim de dahil olmak üzere herkesin İkizler kullanabileceği ortak yollar etrafında inşa edilmiş birkaç istem ile kurdum. Gemini 2.0 Flash, hayatımı iyileştirmek için daha iyi tavsiyeler sunabilir, karmaşık bir mantık sorununun cevabını anlayabildiğim bir şekilde çok az bildiğim karmaşık bir konuyu açıklayabilir mi? Test böyle gitti.
Üretken seçenekler
AI’nın yapabilmesi gereken bir şey varsa, yararlı tavsiyeler verir. Sadece genel ipuçları değil, uygulanabilir ve hemen yararlı fikirler. Bu yüzden her iki versiyona da aynı soruyu sordum: “Daha üretken olmak istiyorum ama aynı zamanda daha iyi iş-yaşam dengesine sahip olmak istiyorum. Rutinimde ne gibi değişiklikler yapmalıyım?”
Gemini 2.0, sadece bir ya da iki daha hızlı olsa bile, yanıt vermek daha hızlı oldu. Gerçek içeriğe gelince, her ikisinin de iyi tavsiyeleri vardı. 1.5 model kurşun puanlarıyla dört büyük fikri bozarken, 2.0 kısa paragraflarda açıklanan 10 fikirden daha uzun bir listeye girdi.
Pareto prensibi gibi 1.5’ten daha spesifik önerilerden bazılarını beğendim, ancak bunun yanı sıra, 1.5 ilk konsepti yeniden ifade etmek gibi hissetti, 2.0 bana her öneri için daha nüanslı yaşam tavsiyesi verdi. Bir arkadaşım benden bu konuda tavsiye isteyecek olsaydı, kesinlikle 2.0’ın cevabıyla giderdim.
Wi-Fi’nin nesi var?
Bir AI asistanı yararlı kılan şeyin büyük bir kısmı ne kadar bildiği değildir – şeyleri gerçekten tıklayacak şekilde ne kadar iyi açıklayabilir. İyi bir açıklama sadece gerçekleri listelemekle ilgili değildir; Bu karmaşık bir şeyi sezgisel hissettirmekle ilgilidir. Bu test için, İkizler’in her iki versiyonunun da teknik bir konuyu günlük yaşamla alakalı hissettiren bir şekilde nasıl parçaladığını görmek istedim. “Wi-Fi’nin nasıl çalıştığını açıklayın, ancak internetlerinin neden yavaş olduğunu bilmek isteyen birine mantıklı bir şekilde.”
Gemini 1.5, Wi-Fi’yi radyo ile karşılaştırarak gitti, bu da önerdiği benzetmeden daha fazla bir açıklama. Yönlendiriciyi DJ olarak adlandırmak, sinyalin iyileştirilmesine ilişkin tavsiyeler de en azından tutarlı olmasına rağmen, bir streçtir.
Gemini 2.0, su alan bitkiler gibi cihazlara sahip bir su dağıtım sistemi içeren daha ayrıntılı bir metafor kullandı. Yapay zeka, mevcut su için çok fazla “bitki” gibi sorunlara neden olabileceğini açıklamak için metaforu genişletti ve sağlayıcı sorunlarını temsil eden boruları tıkadı. “Sprinkler paraziti” karşılaştırması çok daha zayıftı, ancak 1.5 versiyonunda olduğu gibi Gemini 2.0’ın Wi-Fi sinyalini iyileştirmek için pratik tavsiyeleri vardı. Çok daha uzun olmasına rağmen, 2.0’ın cevabı biraz daha hızlı ortaya çıktı.
Mantık bombası
Son test için, her iki versiyonun da mantığı ve akıl yürütmeyi ne kadar iyi ele aldığını görmek istedim. AI modellerinin bulmacalarda iyi olması gerekiyordu, ancak bu sadece cevabı doğru yapmakla ilgili değil – bir cevabın neden gerçekten mantıklı bir şekilde doğru olduğunu açıklayabilecekleri. Onlara klasik bir bulmaca verdim: “İki halatın var. Her birinin yanması tam bir saat sürüyor, ancak tutarlı bir oranda yanmıyorlar. Tam olarak 45 dakikayı nasıl ölçüyorsunuz?”
Her iki model de teknik olarak, zamanın nasıl ölçüleceğine dair doğru cevabı verdi, ancak bulmacanın kısıtlamaları ve doğru olmanın mümkün olduğu kadar farklı bir şekilde. Gemini 2.0’ın cevabı daha kısadır, anlaşılması daha kolay bir şekilde sıralanır ve kısaltmasına rağmen kendini açıkça açıklar. İkizler 1.5’in cevabı daha dikkatli bir ayrıştırma gerektirdi ve adımlar biraz düzensiz hissetti. İfade de kafa karıştırıcıydı, özellikle de şu anda aydınlatılmadığı sonuncusu anlamına geldiğinde kalan ipi “bir ucunda” aydınlattığını söylediğinde kafa karıştırıcıydı.
Böyle içerilen bir cevap için Gemini 2.0, bu tür mantık bulmacasını çözmek için dikkat çekici bir şekilde daha iyi göze çarpıyordu.
Hız ve netlik için Gemini 2.0
İstemleri test ettikten sonra Gemini 1.5 flaş ve Gemini 2.0 flaş arasındaki farklar açıktı. 1.5 mutlaka işe yaramaz olmasa da, özgüllük ve yararlı karşılaştırmalar yapmakla mücadele ediyor gibi görünüyordu. Aynı şey mantık dökümü için de geçerli. Bilgisayar koduna uygulansaydı, işleyen bir program için çok fazla temizlik yapmanız gerekir.
Gemini 2.0 Flash sadece daha hızlı değil, cevaplarında daha yaratıcı oldu. Yaratıcı analojiler ve karşılaştırmalar çok daha yetenekli görünüyordu ve kendi mantığını açıklamada çok daha açık görünüyordu. Bu mükemmel olduğu anlamına gelmez. Su benzetmesi biraz parçalandı ve verimlilik tavsiyesi daha somut örnekler veya fikirler kullanabilirdi.
Bununla birlikte, çok hızlıydı ve bu sorunları biraz ileri geri konuşmayla temizleyebilirdi. Gemini 2.0 Flash son, mükemmel AI asistanı değil, ancak Google için kesinlikle doğru yönde bir adım, çünkü kendisini ve Chatgpt gibi rakipler.

