Neel Somani, bir yazılım mühendisi, eski bir nicel araştırmacı ve girişimci, OpenAI’ın yeni modelinin matematik yeteneklerini test ederken beklenmedik bir keşif yaptı. Problemi ChatGPT’ye yapıştırdıktan 15 dakika bekledikten sonra, tamamlanmış bir çözüme döndü. Kanıtı değerlendirdi ve Harmonic adındaki bir araçla biçimlendirdi — ve her şey doğruydu.
Somani, “LLM’lerin açık matematik problemlerini çözme yeteneğini belirlemek için bir temel oluşturmaktan meraklıydım,” dedi. Beklenmedik olan, en yeni modelin, sınırları biraz ileriye taşımaya başladığıydı.
ChatGPT’nin düşünce zinciri, matematiksel aksiyomları sıralarken Legendre formülü, Bertrand varsayımı ve David yıldızı teoremi gibi önemli bilgileri hatasız şekilde aktardı. Sonunda model, 2013 tarihli bir Math Overflow gönderisine ulaşarak, Harvard matematikçisi Noam Elkies’in benzer bir sorun için sunduğu zarif çözümü buldu. Ancak ChatGPT’nin son kanıtı, Elkies’in çalışmasından önemli farklar taşıdı ve efsanevi matematikçi Paul Erdős’ün ortaya attığı bir sorunun daha kapsamlı bir çözümünü sundu.
Makinelerin zekasına şüpheyle yaklaşanlar için bu şaşırtıcı bir sonuç — ve tek değil. Matematikte, Harmonic’in Aristotle gibi biçimlendirme odaklı LLM’lerden OpenAI’nin derin araştırma araçlarına kadar yapay zeka araçları yaygın hale geldi. Ancak, Somani’nin “anegdot olarak önceki versiyonlarından daha iyi matematiksel akıl yürütme yeteneğine sahip” olarak tanımladığı GPT 5.2’nin piyasaya sürülmesiyle, çözülen problem sayısı göz ardı edilemeyecek bir seviyeye ulaştı; bu da büyük dil modellerinin insan bilgisinin sınırlarını zorlayabilir mi sorusunu gündeme getiriyor.
Somani, Macar matematikçi Erdős’ün online olarak bakımını üstlendiği binin üzerinde tezini inceliyordu. Bu problemler, AI destekli matematik için cazip bir hedef haline geldi ve konu ve zorluk açısından geniş bir yelpaze sunuyor. Otonom çözümlerin ilk grubu, AlphaEvolve adındaki Gemini destekli bir modelden Kasım ayında geldi — fakat daha yakın bir zamanda Somani ve diğerleri GPT 5.2’nin yüksek seviyedeki matematikte dikkat çekici bir beceriye sahip olduğunu keşfetti.
Noel’den bu yana, Erdős web sitesinde “açık” konumdan “çözüldü” konumuna geçiş yapan 15 problem var — bu çözümlerin 11’i, süreçte AI modellerinin katkısının olduğunu doğrudan belirtiyor.
Saygın matematikçi Terence Tao, GitHub sayfasında ilerlemeye dair daha nüanslı bir bakış açısına sahip; burada AI modellerinin sekiz farklı Erdős problemi üzerinde anlamlı ilerleme kaydettiğini ve altı başka vakada önceki araştırmaları bulup bunlar üzerinde geliştirme yaparak ilerleme sağladığını hesaba katıyor. AI sistemlerinin insan müdahalesi olmadan matematik yapabilmesi için uzun bir yol olduğunu; ancak büyük modellerin önemli bir rol oynaması gerektiği açık.
Tao, Mastodon’da, AI sistemlerinin ölçeklenebilir doğasının onları “birçok bakımdan doğrudan çözümlere sahip olan” çok sayıda obscure Erdős problemi üzerinde sistematik bir biçimde uygulanmaları açısından daha uygun hale getirdiğini öne sürdü.
“Bu nedenle, bu daha kolay Erdős problemlerinin artık tamamen AI merkezli yöntemlerle çözülmesi, insan ya da karmaşık yöntemlerle çözülmesinden daha olası,” diye ekledi Tao.
Son zamanlarda biçimlendirmeye yönelik bir kayma da etkili bir etken; bu yoğun emek gerektiren işlem matematiksel akıl yürütmeyi doğrulamayı ve genişletmeyi kolaylaştırıyor. Biçimlendirme, AI veya bilgisayar kullanımını zorunlu kılmaz, ancak yeni bir grup otomatik araç bu süreci çok daha kolay hale getirdi. Microsoft Research’te 2013 yılında geliştirilen açık kaynak “kanıt yardımcı” Lean, kanıtları biçimlendirmenin bir yolu olarak alanda yaygın olarak kullanılmakta — ve Harmonic’in Aristotle gibi yapay zeka araçları, biçimlendirme görevlerinin çoğunu otomatik hale getirmeyi vaat ediyor.
Harmonic’in kurucusu Tudor Achim için çözülen Erdős problemlerindeki ani artış, dünyanın en büyük matematikçilerinin bu araçları ciddiye almaya başlaması kadar önemli. “Matematik ve bilgisayar bilimi profesörlerinin [AI araçlarını] kullandığından daha çok ilgilendim,” diyor Achim. “Bu insanlar itibarlarını korumak zorundalar, dolayısıyla Aristotle veya ChatGPT kullandıklarını belirttiklerinde, bu gerçek bir kanıt oluşturuyor.”


