Un modelo de IA descifró un problema matemático de casi 60 años y sorprendió a los expertos

Un joven sin formación universitaria recurrió a una herramienta de lenguaje para resolver el desafío #1196 de Paul Erdős. Entre escepticismo y certeza, cuáles son las proyecciones de los especialistas

Guardar
Google icon
Ilustración de una figura humana y una IA de perfil colaborando ante una pizarra llena de fórmulas matemáticas. La IA tiene un cuerpo semitransparente con circuitos azules y verdes brillantes
La inteligencia artificial logra avances inéditos en la investigación matemática y contribuye a resolver problemas planteados por Erdős (Imagen Ilustrativa Infobae)

La inteligencia artificial ya no solo calcula: algunos modelos de lenguaje ya aportan razonamientos que especialistas describen como conexiones inesperadas entre subáreas de las matemáticas, informó la revista científica Nature. Thang Luong, responsable del equipo de Razonamiento Sobrehumano de Google DeepMind, señaló que “quizás para 2030” la inteligencia artificial y los matemáticos pudieran ganar juntos una Medalla Fields, el mayor reconocimiento en matemáticas.

Uno de los casos que impulsó ese cambio de percepción ocurrió el mes pasado, cuando Liam Price, un joven del suroeste de Inglaterra sin formación universitaria en matemáticas, resolvió con ayuda de ChatGPT el problema #1196 de Erdős. La solución se describió en una prepublicación de B. Alexeev y colaboradores en el repositorio arXiv, y atrajo atención por su estrategia para los especialistas, señaló la revista.

PUBLICIDAD

El matemático de Stanford Jared Duker Lichtman comparó ese hallazgo con una novedad estratégica en ajedrez, al escribir en la red social X, antes Twitter, que era como si una IA hubiera descubierto una apertura inédita por efecto de la "estética y las convenciones humanas". La observación resumía una idea central en el debate actual: estos sistemas pueden conectar áreas de formas no anticipadas por la intuición humana y trascender la mera reproducción de técnicas conocidas.

Cómo ChatGPT resolvió el problema #1196

El problema #1196, propuesto por Paul Erdős en 1966, trata sobre conjuntos “primitivos” de números enteros; es decir, conjuntos en los que ninguno de sus elementos divide exactamente a otro. Los números primos son el ejemplo más típico de ese tipo de conjuntos.

PUBLICIDAD

De acuerdo con la revista, varios comentaristas han señalado que quienes intentaron resolver ese problema partían del lenguaje de la teoría de la probabilidad y reformulaban así la pregunta. ChatGPT, en cambio, lo resolvió en el lenguaje original del enunciado y, aun así, estableció de forma implícita un vínculo entre números y probabilidad, según Terence Tao, matemático de la Universidad de California en Los Ángeles.

Infografía de IA en matemáticas. Muestra un cerebro digital brillante con ecuaciones y gráficos de fondo, e íconos que representan sus aportes y desafíos.
Esta infografía detalla cómo la inteligencia artificial impulsa la investigación matemática con aportes inéditos y conexiones inesperadas, enfrentando nuevos desafíos en la verificación de demostraciones extensas y complejas (Imagen Ilustrativa Infobae)

Price había obtenido otras soluciones a problemas de Erdős junto con Kevin Barreto, estudiante de grado en matemáticas en la Universidad de Cambridge, pero en esos casos se basaron en técnicas ya presentes en la literatura. En el caso del problema #1196, matemáticos detectaron indicios de que el modelo no se limitó a recombinar técnicas existentes, sino que produjo conexiones que no estaban en su material de entrenamiento.

“Hace un año, la gente pensaba que tal vez habría algún obstáculo fundamental, que los modelos de lenguaje nunca podrían ir más allá de sus datos de entrenamiento”, dijo Sébastien Bubeck, matemático de OpenAI en San Francisco.

El matemático de la Universidad de Toronto Daniel Litt sostuvo que el resultado es “razonablemente interesante”, a diferencia de otros ejemplos recientes de soluciones de IA a problemas de Erdős. Aunque se declaró poco impresionado por buena parte de los avances hasta ahora y crítico de la exageración que los rodea, sostuvo que los escépticos se equivocan al evaluar el potencial futuro de estos sistemas.

Litt manifestó su desconcierto porque las grandes máquinas de lenguaje no generan descubrimientos mayores, dado que tienen un conocimiento sobre las matemáticas existentes que describió como sobrehumano, muestran capacidad de razonamiento y no sufren cansancio ni desmotivación. “Parte del misterio es que no sabemos qué hace bueno a un matemático humano en matemáticas”, explicó.

Una mujer en un laberinto con paredes de fórmulas matemáticas mira hacia una entidad digital brillante que proyecta un camino de luz sobre el laberinto.
Expertos destacan que los modelos de IA ya pueden generar razonamientos innovadores, capaces de descubrir conexiones no anticipadas por la intuición humana (Imagen Ilustrativa Infobae)

Demostraciones más largas, verificación más difícil

Uno de los límites actuales de la producción matemática de IA es la extensión de las demostraciones: los modelos disponibles pueden generar pruebas de 3 o 4 páginas como máximo. Luong indicó que modelos evaluados internamente ya superan ese umbral y podrían llegar pronto a 10 páginas.

“100 no está ahora dentro de sus capacidades, pero estamos trabajando hacia eso y vemos mejoras”, señaló Luong. Ese avance, argumentó, genera nuevos retos, ya que la revisión humana de textos matemáticos generados por IA ya había alcanzado todo su margen antes de la explosión actual de estos sistemas.

La matemática de la Universidad de Harvard Lauren Williams declaró que estos modelos pueden producir trabajos “muy convincentes” cuya verificación requiere mucho tiempo para detectar si contienen errores. También alertó sobre la proliferación de contenido generado por IA de baja calidad o directamente erróneo —lo que describió como “basura de IA”— y remarcó que varios editores de revistas matemáticas ya se enfrentan a ese fenómeno.

Una respuesta frecuente consiste en pedirle a otro modelo, o incluso al mismo, que revise la demostración. Price y Barreto, por ejemplo, reintroducen en ChatGPT las soluciones propuestas para que encuentre sus propios errores y rehaga el intento hasta que la prueba parezca correcta; muchos matemáticos ya usan ese método también con textos propios. A pesar de ello, los modelos aún dejan pasar fallos y a veces detectan otros inexistentes.

Un robot humanoide blanco con ojos azules brillantes manipula tres pantallas holográficas translúcidas que presentan complejas ecuaciones y gráficos matemáticos.
El éxito de ChatGPT al resolver problemas matemáticos complejos impulsa el debate sobre el potencial de la inteligencia artificial para innovar en ciencias exactas (Imagen Ilustrativa Infobae)

Google desarrolló un sistema especializado de múltiples agentes, Aletheia, que incorpora un módulo verificador para texto matemático. Aun así, la alternativa considerada más fiable por varios investigadores es traducir las pruebas al lenguaje formal Lean, un sistema de código abierto que permite verificaciones automáticas.

El matemático computacional Bin Dong y sus colaboradores aplicaron ese enfoque a la resolución de un problema de álgebra. Por su parte, la empresa californiana Math, Inc. utilizó un traductor de ese tipo para acelerar la formalización en Lean del trabajo premiado con la Medalla Fields de Maryna Viazovska, el primer resultado de alto perfil trasladado a ese lenguaje.

Otra opción es que la IA redacte directamente las pruebas en Lean o en sistemas similares —una técnica que inauguró AlphaProof, un sistema de Google DeepMind. El alcance de las matemáticas que hoy pueden escribirse o traducirse a Lean aún es reducido.

First Proof y los límites de la verificación

La solución de ChatGPT al problema #1196 fue un caso poco común que sí pudo formalizarse y certificarse automáticamente, tarea que Barreto llevó a cabo mediante el software desarrollado por Math, Inc. Luong declaró al mismo medio que la expansión de Lean requiere un trabajo lento y detallado de equipos de voluntarios, y que por ahora “solo hay un puñado de problemas que se pueden formalizar; para el resto, se necesita lenguaje natural”.

Esa limitación se evidenció a comienzos de febrero, cuando investigadores realizaron una primera prueba de First Proof, un banco de pruebas para IA en matemáticas documentado en una prepublicación de M. Abouzaid y colaboradores. Expertos de distintas áreas aportaron preguntas cuyas respuestas solo ellos conocían, porque trabajos inéditos propios ya habían adelantado la validez o falsedad de los enunciados.

(Imagen Ilustrativa Infobae)
El primer banco de pruebas para IA en matemáticas, First Proof, mostró que la mayoría de soluciones generadas requieren comprobación manual por expertos (Imagen Ilustrativa Infobae)

De acuerdo con la revista, cualquiera podía presentar soluciones generadas por IA. Casi todas se redactaron en lenguaje natural y solo una se verificó en Lean; algunas se comprobaron manualmente y en otras aún no está claro si son correctas.

En junio, los organizadores de First Proof someterán un nuevo conjunto de preguntas a varios sistemas de IA y verificarán las respuestas de forma manual. Williams, una de las organizadoras, indicó que la prueba se centrará en modelos de acceso público porque son los más habituales para la mayoría de matemáticos: “Esperamos que lo que hagamos sea un servicio para la comunidad de matemáticos”.

A pesar del ritmo de los cambios, el consenso entre los investigadores es que los matemáticos humanos seguirán al frente de la disciplina durante algún tiempo. “Qué problemas estudiar es más una cuestión de juicio. Durante un tiempo, serán los humanos quienes lo hagan”, afirmó Mark Sellke, matemático de OpenAI.

El matemático de la Universidad Brown Javier Gómez-Serrano graficó la velocidad de este cambio con una advertencia: “Ahora ni siquiera me atrevo a pensar cómo será el futuro dentro de cinco años”. Para Jeremy Avigad, matemático de Carnegie Mellon University, el criterio central permanece otro: “En última instancia, el objetivo de las matemáticas es entender los fenómenos matemáticos. Para eso, necesitamos seguir dentro del circuito”.

PUBLICIDAD

PUBLICIDAD