
¿Es 21,269 un número primo, es decir, sólo divisible por 1 y por sí mismo? Si hay algo en lo que las computadoras son buenas es en la aritmética. Según ChatGPT, 21.269 no es un número primo“porque es divisible por 13”. En realidad, 21,269 es primo, algo que cualquier sistema de álgebra computacional puede decirte en una fracción de segundo.
El chatbot comete muchos errores como este. “Chat-GPT es solo un juego de azar”, afirma en una videollamada el matemático Johan Commelin de la Universidad de Utrecht. Por tanto, ChatGPT no es una calculadora, sino un modelo de lenguaje entrenado en una gran base de datos de textos. Carece de lógica formal. Commelin: “Todo el conocimiento que ChatGPT tiene sobre aritmética se basa en sumas de ejemplo que se incluyeron en su capacitación. A partir de esto extrapola cómo espera que se realice un cálculo. Si fuera un chat, también adivinaría que 21.269 no es primo. Después de todo, hay menos números primos de cinco dígitos que números no primos de cinco dígitos”.
Si hay infinitos números primos (sí) es una cuestión que ChatGPT puede manejar mejor. Aparentemente se encontró con esa pregunta durante su formación y puede proporcionar claramente la prueba milenaria que se remonta a Euclides, trescientos años antes de Cristo. La pregunta es mucho más difícil: ¿hay infinitos primos gemelos? ChatGPT sigue sin poder dar una respuesta. No es de extrañar, porque el problema de los primos gemelos sigue sin resolverse. ChatGPT no va más allá de decir qué son los primos gemelos (pares de números primos con una diferencia de 2, como 3 y 5, o 11 y 13) y qué avances se han producido hacia una prueba en las últimas décadas.
ChatGPT no va más allá de decirnos qué son los primos gemelos
¿Qué sucede si le preguntas a ChatGPT si puede resolver el problema de los primos gemelos por sí solo? “¡Sería genial si pudiera hacer eso! Desafortunadamente, encontrar una prueba para un problema como la conjetura de los primos gemelos es extremadamente complejo. Requiere no sólo un conocimiento profundo de la teoría de números, sino a menudo también nuevos conocimientos y técnicas matemáticas que aún no se han descubierto. (…) Como inteligencia artificial, puedo analizar y explicar conceptos y técnicas matemáticas, pero desarrollar nuevas ideas y conocimientos matemáticos aún está más allá de mis capacidades”.
Un detalle interesante es la palabra “todavía” en esta última frase. ¿Llegará algún día el momento en que una inteligencia artificial posea la creatividad de una inteligencia humana? El propio ChatGPT ciertamente mantiene abierta esa opción.
Millones de problemas de geometría
Este año se ha dado un paso importante. La empresa DeepMind, conocida por AlphaGo, AlphaZero y AlphaFold, entre otros, lanzó dos sistemas de IA que han sido desarrollados para resolver problemas matemáticos complejos: AlfaProof y AlfaGeometría. El uso de computadoras en la investigación matemática no es nuevo (ver recuadro). Lo nuevo es que las nuevas herramientas de DeepMind no son “asistentes”, sino que resuelven problemas matemáticos de principio a fin por sí mismas. Combinan las habilidades lingüísticas que conocemos de ChatGPT con un “sistema de razonamiento formal”.
AlphaGeometry está hecho a medida para la geometría euclidiana, es decir, la geometría bidimensional clásica. Esta inteligencia artificial fue entrenada utilizando millones de problemas de geometría, que se generaron automáticamente. Si una estrategia de solución no funcionaba, el sistema buscaba otra estrategia, como por ejemplo: ‘añadir una línea auxiliar allí’, o: ‘reducir ese ángulo a la mitad’. AlphaGeometry se volvió mejor y más rápido en la predicción de construcciones que conducen a una solución correcta. La nueva versión, AlphaGeometry 2, es incluso mejor que su predecesora.
AlphaProof es más general y no, como AlphaGeometry, desarrollado para un área especial. Actualmente, AlphaProof parece poder manejar principalmente álgebra y teoría de números. Commelin: “ChatGPT empieza a inventar cosas y no tiene idea de cuándo está mintiendo. Alpha-Proof puede razonar lógicamente”. AlphaProof puede hacer esto porque utiliza el lenguaje de programación Lean. Lean puede escribir y probar declaraciones. También puede verificar evidencia sin intervención humana. “Existe una interacción entre la IA, que intenta ser creativa, y Lean, que no es creativa, pero conoce las reglas de las matemáticas de manera muy estricta”, dice Commelin, quien también forma parte de la comunidad Lean.
Si le presenta un problema a AlphaProof, buscará una solución o una prueba. La respuesta, o su impulso, se da en el lenguaje Lean. Lean evalúa esto y determina qué pasos de la prueba son legales. Esto evita que la inteligencia artificial fanfarronee. Si se ha realizado un movimiento ilegal o si una carretera resulta ser un callejón sin salida, Lean proporcionará información. Entonces AlphaProof intenta algo diferente. En los problemas difíciles, rara vez se toma inmediatamente el camino correcto. Puede ver esto claramente cuando traduce una solución escrita en Lean al lenguaje normal. Commelin: “A menudo se ven todo tipo de desvíos que no son relevantes. Estos no se filtran. Da la sensación de que AlphaProof está entregando su hoja de desecho”.
El verano pasado tuvo lugar la prueba de fuego para AlphaProof y Alpha-Geometry 2. Se les presentaron los seis problemas de la Olimpiada Internacional de Matemáticas (OMI) sin límite de tiempo. Esta Olimpiada es la competición de matemáticas más prestigiosa para estudiantes de secundaria y se lleva a cabo cada año en julio. En dos sesiones de cuatro horas y media, a los participantes, clasificados tras varias rondas preliminares, se les plantean seis preguntas extremadamente difíciles de teoría de números, álgebra, geometría y combinatoria.
AlphaGeometry 2 logró resolver el problema de geometría en sólo diecinueve segundos. Una persona necesita ese tiempo sólo para leer la tarea: ‘Ella Δ abecedario un triángulo con |AB| Aire acondicionado| antes de Cristo|. Sea ω la circunferencia inscrita del triángulo abecedarioy ella I el centro de ω. Ella incógnita el punto, diferente de doen la línea ANTES DE CRISTO para que la línea pase incógnita que es paralelo a C.A.es tangente a ω. De manera análoga, ella Y el punto, diferente de ben la línea ANTES DE CRISTO para que la línea pase Y que es paralelo a ABes tangente a ω. la linea AI interseca el círculo circunscrito del triángulo abecedario nuevamente en P ≠ A. Los puntos medios de los segmentos de recta. C.A. y AB llamamos respectivamente k y l. Demuestra que ∠Kilo + ∠YPX = 180°.’
AlphaProof resolvió con éxito tres problemas de álgebra y teoría de números. El último problema del torneo, sobre las llamadas “funciones aquazule” (un concepto no existente en matemáticas; fue ideado especialmente para la OMI), fue particularmente complejo: de un total de 609 participantes en la Olimpiada, sólo cinco pudieron resolver ese problema. No es un logro pequeño de AlphaProof.
Pero AlphaProof no es perfecto en absoluto. AlphaProof no pudo resolver los dos problemas de combinatoria, el campo que se ocupa del conteo inteligente de posibilidades, y la solución al problema de teoría de números solo se completó después de tres días completos de sudoración artificial.
Tonterías alucinantes
En septiembre, la empresa OpenAI, propietaria de ChatGPT, también presentó una nueva inteligencia artificial, denominada o1. Al igual que los dos sistemas de DeepMind, o1 afirma ser capaz de “pensar” y “razonar”. Divide los pasos difíciles en pasos más fáciles y prueba un enfoque diferente si el actual no funciona.
Terence Tao, uno de los mejores matemáticos del mundo, de la Universidad de California, lo puso a prueba. Para un problema determinado, que puede resolverse aplicando el “teorema de Cramer”, ChatGPT solo pudo identificar algunos conceptos relevantes. “Pero los detalles eran tonterías alucinatorias”, escribe Tao en Mastodon. Por otro lado, o1 “una respuesta completamente satisfactoria”.
o1 tuvo menos éxito cuando Tao le presentó un problema del matemático húngaro Paul Erdös. El problema en cuestión no se había resuelto hasta hace poco. Tao recientemente logró solucionar el problema; el 2 de septiembre publicó su solución en el servidor de preimpresión arXiv. Tao le dio un poco de la solución y pidió el ingrediente que faltaba. El destacado matemático califica su respuesta de “ligeramente decepcionante”, porque o1 no fue más allá de una propuesta para una estrategia ya existente; Se omitieron variantes creativas.
La intuición, la creatividad y el ingenio –cualidades humanas típicas– son indispensables para llegar a nuevos conocimientos matemáticos. ¿Sistemas como AlphaProof y o1 resolverán algún día un problema abierto como el de los primos gemelos? Muchos matemáticos son cautelosos a la hora de predecir el futuro. Por el momento, Tao califica la creación de estrategias creativas a través de la IA como “bastante débil”.
También hay optimistas. Christian Szegedy, matemático e informático que trabaja en xAI de Elon Musk, es muy franco. Szegedy ha predicho que la IA resolverá un importante problema abierto que los matemáticos no saben cómo resolver antes de 2030. Commelin, como la mayoría de los matemáticos, no se atreve a llegar tan lejos. “Pero tampoco voy a decir que eso nunca sucederá. Probablemente aún no se haya alcanzado el límite”.

