
OpenAI’nin 12 günlük gönderiminin son gününde ChatGPT yapımcısı OpenAI o3’ü duyurdu. Yeni model, OpenAI 01’in halefidir, ancak fark etmiş olabileceğiniz gibi AI firması, amiral gemisi muhakeme modelinin halefi için daha bariz bir isim olan o2’yi atladı.
12. Gün: OpenAI o3 için erken değerlendirmeler (evet, bir sayıyı atladık)https://t.co/iWXg9IGuZM20 Aralık 2024
Tarafından hazırlanan bir rapor Bilgi O2’yi atlama kararının, yakın gelecekte İngiliz telekomünikasyon sağlayıcısı O2 ile çatışma yaratabileceğinden, ticari marka sorunlarına bağlı olduğunu öne sürüyor. AI firması, OpenAI o3’ün yanı sıra, belirli görevleri gerçekleştirmek için tasarlanan yeni nesil modelin daha küçük bir versiyonu olan o3-mini’yi de duyurdu.
Şirket bu ay OpenAI o1’i geniş kapsamlı kullanıma sunsa da, önizleme sürümü güvenlik araştırmacılarıyla sınırlı olacak ve bugün daha sonra kaydolmaya açık olacak. Bu, OpenAI’nin, modeli genel kullanıma sunmadan önce kullanıcı deneyimine ve performansına ince ayar yapma planının bir parçası olabilir.
İlginçtir ki OpenAI o3, paylaşılan kıyaslamalara göre “inanılmaz” kodlama yeteneklerine sahiptir. OpenAI o1 aynı zamanda OpenAI’nin araştırma mühendisi işe alım görüşmesinde %90-100 oranında başarılı olacak kadar etkileyici kodlama yeteneklerine de sahiptir. Ayrıca ARC-AGI’ye (bir modelin karmaşık görevleri ilk kez akıl yürütme ve çözme yeteneğini belirlemek için kullanılan karmaşık bir kıyaslama) göre, görevleri yerine getirme ve karmaşık sorguları yanıtlama konusunda üç kata kadar daha iyi.
OpenAI CEO’su Sam Altman’a göre:
“Bunu yapay zekanın bir sonraki aşamasının başlangıcı olarak görüyoruz. Bu modelleri, çok fazla akıl yürütme gerektiren, giderek daha karmaşık hale gelen görevleri gerçekleştirmek için kullanabileceğiniz yer.”
Benzer şekilde Google, Gemini 2.0 Flash Thinking adlı kendi akıl yürütme modeliyle yapay zeka trenine ayak uydurmaya çalışıyor. Google CEO’su Sundar Pichai, yeni modeli “şimdiye kadarki en düşünceli model” olarak nitelendiriyor. Daha fazla kuruluş yapay zeka trenine binip teknolojiyi iş akışlarına dahil ettikçe muhakeme modelleri giderek daha önemli hale geliyor. Bunun nedeni karmaşık görevleri ve sorguları halledebilecek olmalarıdır.

