Liam Price et la résolution d’un problème mathématique historique

À seulement 23 ans, Liam Price a réalisé un exploit incroyable en résolvant une conjecture mathématique qui avait défié les experts pendant près de 60 ans. En naviguant sur le site problèmes d’Erdös, il a choisi un problème au hasard et l’a soumis à ChatGPT, ignorant l’historique de ce défi mathématique. Moins de 80 minutes plus tard, il a reçu une réponse qui semblait correcte. Après consultation avec un ami étudiant en mathématiques, ils ont compris qu’ils avaient potentiellement découvert quelque chose d’exceptionnel. Peu de temps après, le mathématicien renommé Terence Tao a confirmé la validité de la solution proposée par GPT-5.4.

Une approche innovante

Le problème #1196 d’Erdös portait sur le comportement d’une somme mathématique liée à des ensembles primitifs de nombres entiers. Ces ensembles sont définis de manière à ce qu’aucun élément ne puisse diviser un autre. Jared Lichtman, un mathématicien de Stanford, avait consacré des années à cette problématique. Pourtant, avec l’aide de ChatGPT, une nouvelle voie a été explorée grâce à l’utilisation d’une fonction particulière, la fonction de von Mangoldt. Cette approche avait été négligée par ceux qui avaient tenté de résoudre le problème auparavant.

Une solution partagée

Bien que la solution de GPT-5.4 ait été saluée, il est crucial de noter qu’elle n’était pas parfaite. Selon Lichtman, la sortie brute de ChatGPT était “assez pauvre”, nécessitant une interprétation par des experts. Liam n’a même pas réalisé qu’il détenait la solution jusqu’à ce que son ami la lise. Le développement de cette solution a donc été un effort collaboratif entre l’homme et l’IA, et le dépôt de contributions IA sur GitHub en témoigne.

Controverses et limites de l’IA

Un précédent scandale

Récemment, un autre chercheur d’OpenAI, Sebastien Bubeck, avait affirmé que GPT-5 avait résolu plusieurs problèmes d’Erdös, une déclaration qui a suscité des critiques dans la communauté mathématique. Cette affirmation s’est révélée être infondée, le modèle ayant trouvé des solutions déjà existantes sur Internet. Ce malentendu a mis en lumière la prudence nécessaire lorsqu’on évalue les capacités de l’IA dans le domaine mathématique.

Taux de succès et enregistrements d’IA

Dans leur référence sur les contributions IA aux problèmes d’Erdös, Tao et Nat Sothanaphan ont utilisé un système de classement couleur pour évaluer le succès des soumissions. Parmi les solutions générées par l’IA, seulement quelques-unes ont été jugées définitivement réussies, tandis que de nombreuses autres ont échoué. Le rapport souligne également que les échecs ne sont souvent pas reportés, créant une perception biaisée des capacités de l’IA.

Une révolution en cours ?

Terence Tao a suggéré que le succès de GPT-5.4 dans la résolution du problème d’Erdös pourrait être attribué à ce qu’il appelle un “blocage collectif” au sein de la communauté mathématique. En n’ayant pas de préjugés sur la manière d’aborder le problème, l’IA a ouvert de nouvelles perspectives. La question demeure : cette approche peu orthodoxe pourrait-elle s’avérer révolutionnaire pour les défis mathématiques futurs ? Seul le temps nous le dira.

En somme, si cette avancée suscite un grand intérêt, elle soulève également des questions cruciales sur le rôle de l’IA dans les mathématiques et la manière dont nous percevons et résolvons les problèmes complexes.



F1-ES