OpenAI'nin o3'ü, AI modellerinin yeni yollarla ölçeklendiğini gösteriyor - ancak maliyetler de öyle - Teknomers | Dünyadan Güncel Teknoloji | Oyun | Müzik | Film

Geçen ay, AI kurucuları ve yatırımcıları TechCrunch’a şu anda “yasaların ölçeklendirilmesinde ikinci çağda” olduğumuzu söylediler ve AI modellerini iyileştirmeye yönelik yerleşik yöntemlerin nasıl azalan getiriler gösterdiğine dikkat çektiler. Kazançları korumak için önerdikleri umut verici yeni yöntemlerden biri de “test zamanı ölçeklendirmesi” idi; bu, OpenAI’nin o3 modelinin performansının arkasında yatan şey gibi görünüyor – ancak bunun da kendi dezavantajları var.

Yapay zeka dünyasının büyük bir kısmı, OpenAI’nin o3 modelinin duyurusunu, yapay zeka ölçeklendirme ilerlemesinin “duvara çarpmadığının” kanıtı olarak kabul etti. o3 modeli kıyaslamalarda iyi bir performans sergiliyor, ARC-AGI adı verilen bir genel yetenek testinde diğer tüm modelleri önemli ölçüde geride bırakıyor ve genel değerlendirmede %25 puan alıyor. zor matematik testi başka hiçbir yapay zeka modelinin %2’den fazla puan alamadığı görüldü.

Elbette biz TechCrunch olarak o3’ü kendimiz test edene kadar tüm bunlara biraz şüpheyle yaklaşıyoruz (şu ana kadar çok az kişi bunu denedi). Ancak o3 yayınlanmadan önce bile yapay zeka dünyası büyük bir şeyin değiştiğine ikna olmuştu.

OpenAI’nin o-serisi modellerin ortak yaratıcısı Noam Brown Cuma günü, girişimin o3’ün etkileyici kazanımlarını, girişimin o1’i duyurmasından sadece üç ay sonra açıkladığını belirtti; bu, performansta böyle bir sıçrama için nispeten kısa bir zaman dilimiydi.

OpenAI’nin o-serisinin ARC-AGI testindeki performansını gösteren tablo.(Resim kredisi: ARC Ödülü)

genel-24

OpenAI’nin o3’ü, AI modellerinin yeni yollarla ölçeklendiğini gösteriyor – ancak maliyetler de öyle

Sanal Medya

Son Eklenenler

Acil: SleeperGem, Geliştiricileri Hedefleyen Üç Zararlı RubyGems Kullanıyor

Ölçekleme Yaparken Ek Yük Olmadan: Laravel Modüler Monolit 🏢

Kritik: Dünyanın En Büyük AI Model Deposu Hugging Face Hedefte!

Geliştirici Günlüğü: 2026-07-19

Laravel Uygulamasının Güvenliğini Tek Komutla Denetleme (Terminal Gerektirmez)

Ben Affleck’in AI Film Yapım Girişimine Netflix’ten Dev Yatırım

Siber güvenlik, yapay zeka ve savunma sanayiinden; finans ve sinema dünyasına uzanan geniş bir yelpaze. Teknomers; teknoloji, strateji ve yazılım dünyasını sade bir dille sizlerle buluşturuyor.

Kurumsal

Kategoriler

Populer