Salı günü Google, bir soruyu cevaplamadan önce “düşünmek” için duraklayan yeni bir AI akıl yürütme modelleri ailesi olan Gemini 2.5’i tanıttı.
Yeni model ailesini başlatmak için Google, şirketin şimdiye kadarki en akıllı modeli olduğunu iddia ettiği çok modlu, akıl yürütme yapay zeka modeli olan Gemini 2.5 Pro Experimental’i piyasaya sürüyor. Bu model Salı günü şirketin geliştirici platformu Google AI Studio’da ve şirketin aylık 20 dolarlık AI planı Gemini Advanced’e aboneler için Gemini uygulamasında sunulacak.
İleride, Google, tüm yeni AI modellerinin pişirilmiş akıl yürütme yeteneklerine sahip olacağını söylüyor.
Openai, Eylül 2024’te ilk AI akıl yürütme modelini başlattığından beri, teknoloji endüstrisi bu modelin yeteneklerini kendileriyle eşleştirmek veya aşmak için yarıştı. Bugün, Antropic, Deepseek, Google ve Xai’nin hepsinde, bir cevap vermeden önce sorunlarla ekstra hesaplama gücü ve gerçeği kontrol etmek ve akıl yürütme zamanı kullanan AI akıl yürütme modelleri var.
Akıl yürütme teknikleri AI modellerinin matematik ve kodlama görevlerinde yeni yüksekliklere ulaşmasına yardımcı olmuştur. Teknoloji dünyasındaki birçoğu, akıl yürütme modellerinin AI ajanlarının, büyük ölçüde insan müdahalesini gerçekleştirebilen özerk sistemlerin temel bir bileşeni olacağına inanıyor. Ancak, bu modeller de daha pahalıdır.
Google, daha önce Aralık ayında Gemini’nin “düşünme” versiyonunu yayınlayarak daha önce AI akıl yürütme modellerini denedi. Ancak Gemini 2.5, şirketin Openai’nin “O” serisi modellerini en iyi şekilde kullanma konusundaki en ciddi girişimini temsil ediyor.
Google, Gemini 2.5 Pro’nun önceki Frontier AI modellerinden ve bazı önde gelen AI modellerinden birkaç ölçütte daha iyi performans gösterdiğini iddia ediyor. Özellikle Google, Gemini 2.5’i görsel olarak zorlayıcı web uygulamaları ve aracı kodlama uygulamaları oluşturmak için mükemmelleştirmek için tasarladığını söylüyor.
Aider Polyglot olarak adlandırılan bir değerlendirme kodu düzenlemesinde, Google, Gemini 2.5 Pro skorlarının%68.6’sını, Openai, Antropic ve Çin AI laboratuvar Deepseek’ten en iyi AI modellerinden daha iyi performans gösterdiğini söylüyor.
Bununla birlikte, yazılım geliştirme yeteneklerini ölçen başka bir testte, SWE-Bench, Gemini 2.5 Pro skorları%63.8, Openai’nin O3-Mini ve Deepseek’in R1’den daha iyi performans gösterdi, ancak Antropic’in Claude 3.7 sonnet’i%70.3 puan aldı.
İnsanlığın son sınavında, Matematik, Beşeri Bilimler ve Doğa Bilimleri ile ilgili binlerce kitle kaynaklı sorudan oluşan çok modlu bir test, Google, Gemini 2.5 Pro puanlarının%18.8’ini, çoğu rakip amiral gemisi modelinden daha iyi performans gösterdiğini söylüyor.
Başlangıç olarak Google, Gemini 2.5 Pro’nun 1 milyon belirteç bağlam penceresiyle gönderildiğini söylüyor, bu da AI modelinin tek bir seferde yaklaşık 750.000 kelime alabileceği anlamına geliyor. Bu, tüm “Yüzüklerin Efendisi” kitap serisinden daha uzun. Ve yakında Gemini 2.5 Pro, giriş uzunluğunun iki katını (2 milyon jeton) destekleyecek.
Google, Gemini 2.5 Pro için API fiyatlandırması yayınlamadı. Şirket, önümüzdeki haftalarda daha fazla paylaşacağını söylüyor.

