
La inteligencia artificial ya no solo calcula: algunos modelos de lenguaje ya aportan razonamientos que especialistas describen como conexiones inesperadas entre subáreas de las matemáticas, informó la revista científica Nature. Thang Luong, responsable del equipo de Razonamiento Sobrehumano de Google DeepMind, señaló que “quizás para 2030” la inteligencia artificial y los matemáticos pudieran ganar juntos una Medalla Fields, el mayor reconocimiento en matemáticas.
Uno de los casos que impulsó ese cambio de percepción ocurrió el mes pasado, cuando Liam Price, un joven del suroeste de Inglaterra sin formación universitaria en matemáticas, resolvió con ayuda de ChatGPT el problema #1196 de Erdős. La solución se describió en una prepublicación de B. Alexeev y colaboradores en el repositorio arXiv, y atrajo atención por su estrategia para los especialistas, señaló la revista.
PUBLICIDAD
El matemático de Stanford Jared Duker Lichtman comparó ese hallazgo con una novedad estratégica en ajedrez, al escribir en la red social X, antes Twitter, que era como si una IA hubiera descubierto una apertura inédita por efecto de la "estética y las convenciones humanas". La observación resumía una idea central en el debate actual: estos sistemas pueden conectar áreas de formas no anticipadas por la intuición humana y trascender la mera reproducción de técnicas conocidas.
Cómo ChatGPT resolvió el problema #1196
El problema #1196, propuesto por Paul Erdős en 1966, trata sobre conjuntos “primitivos” de números enteros; es decir, conjuntos en los que ninguno de sus elementos divide exactamente a otro. Los números primos son el ejemplo más típico de ese tipo de conjuntos.
PUBLICIDAD
De acuerdo con la revista, varios comentaristas han señalado que quienes intentaron resolver ese problema partían del lenguaje de la teoría de la probabilidad y reformulaban así la pregunta. ChatGPT, en cambio, lo resolvió en el lenguaje original del enunciado y, aun así, estableció de forma implícita un vínculo entre números y probabilidad, según Terence Tao, matemático de la Universidad de California en Los Ángeles.

Price había obtenido otras soluciones a problemas de Erdős junto con Kevin Barreto, estudiante de grado en matemáticas en la Universidad de Cambridge, pero en esos casos se basaron en técnicas ya presentes en la literatura. En el caso del problema #1196, matemáticos detectaron indicios de que el modelo no se limitó a recombinar técnicas existentes, sino que produjo conexiones que no estaban en su material de entrenamiento.
PUBLICIDAD
“Hace un año, la gente pensaba que tal vez habría algún obstáculo fundamental, que los modelos de lenguaje nunca podrían ir más allá de sus datos de entrenamiento”, dijo Sébastien Bubeck, matemático de OpenAI en San Francisco.
El matemático de la Universidad de Toronto Daniel Litt sostuvo que el resultado es “razonablemente interesante”, a diferencia de otros ejemplos recientes de soluciones de IA a problemas de Erdős. Aunque se declaró poco impresionado por buena parte de los avances hasta ahora y crítico de la exageración que los rodea, sostuvo que los escépticos se equivocan al evaluar el potencial futuro de estos sistemas.
PUBLICIDAD
Litt manifestó su desconcierto porque las grandes máquinas de lenguaje no generan descubrimientos mayores, dado que tienen un conocimiento sobre las matemáticas existentes que describió como sobrehumano, muestran capacidad de razonamiento y no sufren cansancio ni desmotivación. “Parte del misterio es que no sabemos qué hace bueno a un matemático humano en matemáticas”, explicó.

Demostraciones más largas, verificación más difícil
Uno de los límites actuales de la producción matemática de IA es la extensión de las demostraciones: los modelos disponibles pueden generar pruebas de 3 o 4 páginas como máximo. Luong indicó que modelos evaluados internamente ya superan ese umbral y podrían llegar pronto a 10 páginas.
PUBLICIDAD
“100 no está ahora dentro de sus capacidades, pero estamos trabajando hacia eso y vemos mejoras”, señaló Luong. Ese avance, argumentó, genera nuevos retos, ya que la revisión humana de textos matemáticos generados por IA ya había alcanzado todo su margen antes de la explosión actual de estos sistemas.
La matemática de la Universidad de Harvard Lauren Williams declaró que estos modelos pueden producir trabajos “muy convincentes” cuya verificación requiere mucho tiempo para detectar si contienen errores. También alertó sobre la proliferación de contenido generado por IA de baja calidad o directamente erróneo —lo que describió como “basura de IA”— y remarcó que varios editores de revistas matemáticas ya se enfrentan a ese fenómeno.
PUBLICIDAD
Una respuesta frecuente consiste en pedirle a otro modelo, o incluso al mismo, que revise la demostración. Price y Barreto, por ejemplo, reintroducen en ChatGPT las soluciones propuestas para que encuentre sus propios errores y rehaga el intento hasta que la prueba parezca correcta; muchos matemáticos ya usan ese método también con textos propios. A pesar de ello, los modelos aún dejan pasar fallos y a veces detectan otros inexistentes.

Google desarrolló un sistema especializado de múltiples agentes, Aletheia, que incorpora un módulo verificador para texto matemático. Aun así, la alternativa considerada más fiable por varios investigadores es traducir las pruebas al lenguaje formal Lean, un sistema de código abierto que permite verificaciones automáticas.
PUBLICIDAD
El matemático computacional Bin Dong y sus colaboradores aplicaron ese enfoque a la resolución de un problema de álgebra. Por su parte, la empresa californiana Math, Inc. utilizó un traductor de ese tipo para acelerar la formalización en Lean del trabajo premiado con la Medalla Fields de Maryna Viazovska, el primer resultado de alto perfil trasladado a ese lenguaje.
Otra opción es que la IA redacte directamente las pruebas en Lean o en sistemas similares —una técnica que inauguró AlphaProof, un sistema de Google DeepMind. El alcance de las matemáticas que hoy pueden escribirse o traducirse a Lean aún es reducido.
PUBLICIDAD
First Proof y los límites de la verificación
La solución de ChatGPT al problema #1196 fue un caso poco común que sí pudo formalizarse y certificarse automáticamente, tarea que Barreto llevó a cabo mediante el software desarrollado por Math, Inc. Luong declaró al mismo medio que la expansión de Lean requiere un trabajo lento y detallado de equipos de voluntarios, y que por ahora “solo hay un puñado de problemas que se pueden formalizar; para el resto, se necesita lenguaje natural”.
Esa limitación se evidenció a comienzos de febrero, cuando investigadores realizaron una primera prueba de First Proof, un banco de pruebas para IA en matemáticas documentado en una prepublicación de M. Abouzaid y colaboradores. Expertos de distintas áreas aportaron preguntas cuyas respuestas solo ellos conocían, porque trabajos inéditos propios ya habían adelantado la validez o falsedad de los enunciados.

De acuerdo con la revista, cualquiera podía presentar soluciones generadas por IA. Casi todas se redactaron en lenguaje natural y solo una se verificó en Lean; algunas se comprobaron manualmente y en otras aún no está claro si son correctas.
En junio, los organizadores de First Proof someterán un nuevo conjunto de preguntas a varios sistemas de IA y verificarán las respuestas de forma manual. Williams, una de las organizadoras, indicó que la prueba se centrará en modelos de acceso público porque son los más habituales para la mayoría de matemáticos: “Esperamos que lo que hagamos sea un servicio para la comunidad de matemáticos”.
A pesar del ritmo de los cambios, el consenso entre los investigadores es que los matemáticos humanos seguirán al frente de la disciplina durante algún tiempo. “Qué problemas estudiar es más una cuestión de juicio. Durante un tiempo, serán los humanos quienes lo hagan”, afirmó Mark Sellke, matemático de OpenAI.
El matemático de la Universidad Brown Javier Gómez-Serrano graficó la velocidad de este cambio con una advertencia: “Ahora ni siquiera me atrevo a pensar cómo será el futuro dentro de cinco años”. Para Jeremy Avigad, matemático de Carnegie Mellon University, el criterio central permanece otro: “En última instancia, el objetivo de las matemáticas es entender los fenómenos matemáticos. Para eso, necesitamos seguir dentro del circuito”.
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Por qué dejar la funda mientras cargas el celular puede convertirse en un problema silencioso
Aunque parezca un hábito inofensivo, cargar el teléfono con funda podría reducir la vida útil de la batería y provocar sobrecalentamiento con el paso del tiempo

Qué pasa si colocas papel aluminio debajo del módem WiFi y por qué este truco se volvió popular
Aunque no reemplaza repetidores ni routers modernos, el papel aluminio se convirtió en una solución casera popular para potenciar el internet en habitaciones alejadas

Por qué las teclas CTRL y ALT de tu PC pueden ayudarte a ahorrar tiempo de trabajo
Los atajos con estos botones mejoran el manejo en programas de diseño, edición de texto, navegación web y videojuegos

Así puedes verificar si un iPhone es original y evitar caer en estafas
Revisar el IMEI, el número de serie y funciones exclusivas como True Tone puede ayudar a detectar iPhone falsificados o reparados con componentes no originales
Así funciona la herramienta de IA que podría identificar cómo actúan los genes sin experimentos de laboratorio
El sistema, denominado GSFM y publicado en la revista Patterns, se entrenó con cientos de miles de investigaciones independientes y demostró capacidad para detectar dianas terapéuticas y biomarcadores en múltiples enfermedades



