Buna akıl yürütme rönesansı diyebilirsiniz.
OpenAI’nin akıl yürütme modeli olarak adlandırılan o1’in piyasaya sürülmesinin ardından, rakip yapay zeka laboratuvarlarının akıl yürütme modellerinde bir patlama yaşandı. Kasım ayı başlarında, niceliksel tüccarlar tarafından finanse edilen bir yapay zeka araştırma şirketi olan DeepSeek, ilk akıl yürütme algoritması DeepSeek-R1’in bir ön izlemesini başlattı. Aynı ay, Alibaba’nın Qwen ekibi, o1’e ilk “açık” rakip olduğunu iddia ettiği şeyi açıkladı.
Peki baraj kapaklarını ne açtı? Birincisi, üretken yapay zeka teknolojisini geliştirmek için yeni yaklaşımlar arayışı. Meslektaşım Max Zeff’in yakın zamanda bildirdiği gibi, modelleri büyütmek için kullanılan “kaba kuvvet” teknikleri artık bir zamanlar sağladığı iyileştirmeleri sağlayamıyor.
Yapay zeka şirketlerinin mevcut inovasyon hızını sürdürmeleri konusunda yoğun bir rekabet baskısı var. Binaen Bir tahmine göre, küresel yapay zeka pazarı 2023’te 196,63 milyar dolara ulaştı ve 2030’da 1,81 trilyon dolara ulaşması bekleniyor.
OpenAI, akıl yürütme modellerinin önceki modellere göre “daha zor sorunları çözebileceğini” ve üretken yapay zeka gelişiminde bir adım değişikliği temsil ettiğini iddia etti. Ancak herkes akıl yürütme modellerinin ileriye yönelik en iyi yol olduğuna ikna olmuş değil.
Makine öğrenimi alanında doçent olan Ameet Talwalkar Carnegie Mellon, akıl yürütme modellerinin ilk ürününün “oldukça etkileyici” olduğunu söylüyor. Ancak aynı anda bana, akıl yürütme modellerinin sektörü ne kadar ileri götüreceğini kesin olarak bildiğini iddia eden herkesin “güdülerini sorgulayacağını” söyledi.
Talwalkar, “Yapay zeka şirketlerinin, teknolojilerinin gelecekteki versiyonlarının yetenekleri hakkında umut verici tahminler sunma konusunda mali teşvikleri var” dedi. “Tek bir paradigmaya miyop bir şekilde odaklanma riskiyle karşı karşıyayız; bu nedenle, daha geniş AI araştırma topluluğunun bu şirketlerin abartılı reklamlarına ve pazarlama çabalarına körü körüne inanmaktan kaçınması ve bunun yerine somut sonuçlara odaklanması çok önemlidir.”
Akıl yürütme modellerinin iki dezavantajı, (1) pahalı olmaları ve (2) güce aç olmalarıdır.
Örneğin, OpenAI’nin API’sinde şirket, her ~750.000 kelimelik analiz için 15 ABD Doları ve modelin ürettiği her ~750.000 kelime için 60 ABD Doları ücret almaktadır. Bu, OpenAI’nin en yeni “akıl yürütmeyen” modeli GPT-4o’nun maliyetinin 3 ila 4 katı arasında bir rakam.
O1, OpenAI’nin yapay zeka destekli sohbet robotu platformu ChatGPT’de ücretsiz ve sınırlı olarak mevcuttur. Ancak bu ayın başlarında OpenAI, yılda 2.400 dolara mal olan, daha gelişmiş bir o1 katmanı olan o1 pro modunu tanıttı.
“Genel maliyet [large language model] UCLA’da bilgisayar bilimi profesörü Guy Van Den Broeck, TechCrunch’a şöyle konuştu: “Mantık kesinlikle çökmüyor.”
Akıl yürütme modellerinin bu kadar maliyetli olmasının nedenlerinden biri, çalıştırılmaları için çok fazla bilgi işlem kaynağı gerektirmeleridir. Çoğu yapay zekanın aksine, o1 ve diğer akıl yürütme modelleri, kendi işlerini yaparken kontrol etmeye çalışır. Bu, normalde modelleri tökezleten bazı tuzaklardan kaçınmalarına yardımcı olur; olumsuz tarafı ise çözümlere ulaşmanın genellikle daha uzun sürmesidir.
OpenAI, gelecekteki akıl yürütme modellerinin saatlerce, günlerce ve hatta haftalarca “düşünmesini” öngörüyor. Şirket, kullanım maliyetlerinin daha yüksek olacağını kabul ediyor, ancak getiriler – yeni kanser ilaçlarına çığır açan piller – buna değer olabilir.
Günümüzün muhakeme modellerinin değer teklifi daha az açıktır. Kâr amacı gütmeyen kuruluş Ai2’de araştırmacı ve makine öğrenimi mühendisi olan Costa Huang şunu belirtiyor: o1 çok güvenilir bir hesap makinesi değil. Ve sosyal medyada üstünkörü yapılan aramalarda bir dizi o1 pro modu ortaya çıkıyor hatalar.
Huang, TechCrunch’a “Bu akıl yürütme modelleri uzmanlaşmıştır ve genel alanlarda düşük performans gösterebilir” dedi. “Bazı sınırlamalar diğer sınırlamalardan daha çabuk aşılacaktır.”
Van den Broeck, akıl yürütme modellerinin performans göstermediğini ileri sürüyor gerçek muhakeme yeteneği vardır ve dolayısıyla başarılı bir şekilde üstesinden gelebilecekleri görev türleri sınırlıdır. “Doğru akıl yürütme sadece olası sorunlarda değil, tüm sorunlarda işe yarar. [in a model’s training data]dedi. “Hala üstesinden gelinmesi gereken temel zorluk budur.”
Akıl yürütme modellerini artırmaya yönelik güçlü piyasa teşviki göz önüne alındığında, bunların zamanla daha iyi olacağı kesindir. Sonuçta bu yeni yapay zeka araştırmalarına yatırım yapanlar yalnızca OpenAI, DeepSeek ve Alibaba değil. Risk sermayedarları ve bitişik sektörlerdeki kurucular, akıl yürüten yapay zekanın hakim olduğu bir gelecek fikri etrafında birleşiyor.
Ancak Talwalkar, büyük laboratuvarların bu gelişmelere ayak uyduracağından endişe ediyor.
“Büyük laboratuvarların gizli kalmak için anlaşılır bir şekilde rekabetçi nedenleri var, ancak bu şeffaflık eksikliği, araştırma topluluğunun bu fikirlerle ilgilenme yeteneğini ciddi şekilde engelliyor” dedi. “Daha fazla insan bu yönde çalıştıkça, [reasoning models to] hızla ilerlemek. Ancak buradaki mali teşvikler göz önüne alındığında, fikirlerin bir kısmı akademiden gelecek olsa da, modellerin tümü olmasa da çoğunun OpenAI gibi büyük endüstriyel laboratuvarlar tarafından sunulmasını bekliyorum.”

