Cómo es el experimento matemático que pone bajo la lupa el razonamiento de la IA

Guardar

Computadora, tablero, ecuación, misterio matemático, cálculos, matemáticas - (Imagen Ilustrativa Infobae)

El proyecto “First Proof” busca evidenciar si efectivamente los sistemas de inteligencia artificial son capaces de resolver problemas matemáticos similares a los que deben enfrentar los especialistas en su trabajo cotidiano (Imagen Ilustrativa Infobae)

¿La razón humana o la razón algorítmica? Es una pregunta que suele hacerse en este nuevo presente de inteligencia artificial ingresando en gran parte de nuestra cotidianidad; y en especial en la forma en que aprendemos y adquirimos nuevos conocimientos.

En las redes sociales, siempre se comparten preguntas que apuntan a desafiar a la IA en sus respuestas, pero qué ocurre con las matemáticas se da un razonamiento real o es solo una repetición de información adquirida y analizada.

El proyecto “First Proof”- que si bien su traducción literal es primera prueba; también hace referencia, como lo indica en su sitio oficial, al mundo de la panadería en cuanto al proceso de fermentación de la masa previa a la división y armado de los panes; el llamado “primer leudado”.

Cinco capas apiladas: tanques y drones, servidores, redes digitales, iconos interoperables y gráficos de IA sobre fondo oscuro.

La hipótesis que trabajan en el proyecto es que la IA no “resuelve” un problema sino que “está recordando” toda la información que pudo procesar (Imagen Ilustrativa Infobae)

El ambicioso proyecto

El pasado 5 de febrero de 2026, once matemáticos internacionales que trabajan y enseñan en las universidades más prestigiosas publicaron un paper en el servidor de prepublicaciones arXic que generó interés inmediato.

El equipo está integrado por Mohammed Abouzaid (Stanford University), Andrew J. Blumberg (Columbia University), Martin Hairer (EPFL e Imperial College)- ganador de la Medalla Fields (2014), el máximo galardón de las matemáticas-, Joe Kileel (Universidad de Texas en Austin), Tamara G. Kolda (MathSci.ai), Paul D. Nelson (Universidad de Aarhus), Daniel Spielman (Yale University)- reconocido internacionalmente por sus trabajos a la teoría espectral de grafos y a los algoritmos-, Nikhil Srivastava (Universidad de California, Berkeley), Rachel Ward (Universidad de Texas en Austin), Shmuel Weinberger (Universidad de Chicago) y Lauren Williams (Harvard University), quien es además miembro de la Academia Nacional de Ciencias de Estados Unidos y especialista en combinatoria algebraica .

¿En qué consta “First Proof”? En poder evidenciar y evaluar si efectivamente los sistemas de inteligencia artificial son capaces de resolver problemas matemáticos de investigación real, similares a los que deben enfrentar los especialistas en ciencias matemáticas en su trabajo cotidiano.

La idea de utilizar la metáfora de la panadería no es azarosa; justamente lo que se intenta analizar es esa primera instancia y entender el real razonamiento matemático autónomo de la IA.

Un dato importante es que ninguno de los integrantes de esta investigación está vinculado a empresas que desarrollen modelos de IA, ni tampoco recibió financiamiento de partes interesadas de la industria.

Escritorio moderno con tres grandes monitores encendidos mostrando gráficos y código, sin personas visibles.

Ninguno de los integrantes de esta investigación está vinculado a empresas que desarrollan modelos de IA (Imagen Ilustrativa Infobae)

¿La IA razona las matemáticas?

El punto inicial del proyecto es una crítica metodológica al actual estado de evaluación de la IA en matemáticas, ya que suelen evaluar el desempeño algorítmico basado en problemas de competencias matemáticas, pero que no refleja la práctica de la matemática creativa como si lo hacen los investigadores del área.

Existe una “contaminación de datos” que no permite evaluar la real capacidad de la IA, ya que los grandes modelos de lenguaje son entrenados con libros de textos, problemas de olimpiadas, soluciones publicadas y/o discusiones académicas en la web.

De esta forma, la hipótesis que trabajan en el proyecto es que la IA no “resuelve” un problema sino que “está recordando” toda la información que pudo procesar. Para poder analizar si realmente la IA posee un razonamiento matemático creativo “las respuestas a los problemas no deberían haber sido nunca antes publicadas online y/o ser parte de su entrenamiento”.

Primer plano de una Pascalina antigua con ruedas numeradas desgastadas y cubierta de polvo visible.

El próximo 14 de marzo -día internacional de Pi- se realizará una segunda prueba del proyecto (Imagen Ilustrativa Infobae)

Diez problemas inéditos

A partir de investigaciones de los participantes del proyecto- nunca publicadas- es que se trabaja en evaluar a la IA. Las preguntas representan problemas reales de investigación de seres humanos altamente especializados en resolver problemas matemáticos.

Lo interesante es que los problemas sí fueron resueltos por humanos, por lo que no son imposibles. Pero ¿puede la IA resolverlos sin tener información previa? Se trata de ejercicios de campos como la combinatoria algebraica, la teoría espectral de grafos, la topología algebraica, el análisis estocástico, la geometría simplética; entre otros.

Las soluciones humanas fueron cifradas y guardas en el sitio oficial del proyecto (1stproof.org) y se evaluaron a modelos de IA en modalidad “one- shot”; es decir un único intento por problema sin pistas previas. Se utilizaron GPT-5.1 Pro y Gemini 3 Pro.

El experimento demostró que los sistemas de IA analizados solo pudieron responder dos de las diez preguntas de forma correcta con cierta mínima excelencia esperable para este tipo de experimento. Resultados que ponen el foco en que la brecha entre el razonamiento humano y la inteligencia artificial todavía tiene varios debates por saldar.

Los sistemas actuales son capaces de generar texto sofisticado y coherente matemático, pero no necesariamente implica que sepan resolver cualquier problema.

Por su parte la compañía OpenAI quiso sumarse a intentar solucionar los problemas y si bien aseguran que lograron generar soluciones candidatas para cada uno de los problemas en cuestión de minutos, la verificación de los mismos requirió de trabajo humano experto de horas; generando un cuello de botella en el proceso.

Se espera que el proyecto First Proof continúe analizando la IA y que el próximo 14 de marzo- día internacional de Pi- se realice una segunda prueba y así crear un sistema de evaluación de razonamiento algorítmico en matemáticas a largo plazo.

Últimas Noticias

La educación se plantea qué hacer frente a la inteligencia artificial y define pautas de uso

La escuela de abogacía de la Universidad de Chicago estableció una estrategia: los estudiantes deben aprender a pensar de manera independiente sin apoyarse en la IA, pero también deben egresar listos para trabajar con instrumentos que ya están disponibles

Día internacional del emoji: ¿qué impacto pedagógico tienen en la comunicación?

Esta efeméride particular se celebra desde 2014 e invita a todos los usuarios de redes sociales, foros y mensajería instantánea a hablar un único lenguaje en común: el de los emojis, pero ¿es tan universal como se cree?

6 de cada 10 chicos de 8 años tienen celular: afirman que la prohibición escolar no garantiza mejores aprendizajes

El 59% de los alumnos argentinos de tercer grado cuenta con un teléfono personal. Las restricciones en la escuela reducen el uso y las distracciones en clase, pero los estudios arrojan resultados dispares sobre su impacto académico. En el país, al menos 11 jurisdicciones ya avanzaron con regulaciones

Martín Nistal sobre las mejoras en las pruebas Aprender: “Deberíamos tener un consenso sobre los métodos de alfabetización que funcionan mejor”

El director del Observatorio de la Organización Argentinos por la Educación estuvo invitado en el podcast de la solución integral Ticmas para reflexionar sobre el resultado de las pruebas estandarizadas con las que evalúa la Nación, el presente educativo y el tiempo en la escuela; entre otros temas

El Salvador recibe un reconocimiento de la UNESCO por avances en la educación superior

La distinción fue anunciada por el subdirector general de Educación, Qun Chen, durante la apertura del II Congreso Internacional Modelo Educativo País en San Salvador, con participación de delegaciones de más de 45 países

Cómo es el experimento matemático que pone bajo la lupa el razonamiento de la IA

El proyecto llamado “First Proof” es un riguroso test internacional que busca evidenciar si los modelos de lenguaje de inteligencia artificial razonan o solo memorizan

Últimas Noticias

La educación se plantea qué hacer frente a la inteligencia artificial y define pautas de uso

La escuela de abogacía de la Universidad de Chicago estableció una estrategia: los estudiantes deben aprender a pensar de manera independiente sin apoyarse en la IA, pero también deben egresar listos para trabajar con instrumentos que ya están disponibles

Día internacional del emoji: ¿qué impacto pedagógico tienen en la comunicación?

Esta efeméride particular se celebra desde 2014 e invita a todos los usuarios de redes sociales, foros y mensajería instantánea a hablar un único lenguaje en común: el de los emojis, pero ¿es tan universal como se cree?

6 de cada 10 chicos de 8 años tienen celular: afirman que la prohibición escolar no garantiza mejores aprendizajes

Martín Nistal sobre las mejoras en las pruebas Aprender: “Deberíamos tener un consenso sobre los métodos de alfabetización que funcionan mejor”

El Salvador recibe un reconocimiento de la UNESCO por avances en la educación superior

La distinción fue anunciada por el subdirector general de Educación, Qun Chen, durante la apertura del II Congreso Internacional Modelo Educativo País en San Salvador, con participación de delegaciones de más de 45 países

DEPORTES

FIFA confirmó la indumentaria que vestirán Argentina y España en la gran final del Mundial 2026: el guiño a Qatar 2022 de la Scaloneta

Franco Colapinto terminó 7° en una segunda práctica del Gran Premio de Bélgica marcada por el accidente de Pierre Gasly

Qué dijo LeBron James sobre su salida de Los Angeles Lakers durante el evento Fanatics Fest NYC

La alegría de Franco Colapinto tras protagonizar una de sus mejores prácticas en Alpine: “Fue un gran día”

La tradición de los recientes títulos que repetirá la selección argentina en la última conferencia de prensa de Lionel Scaloni antes de la final del Mundial

TELESHOW

Benjamín Vicuña, Esteban Lamothe y una mirada particular sobre los mitos argentinos: “Eso no es verdad”

Pamela David habló de la salud de Daniel Vila tras su operación en Estados Unidos: “Salió todo muy bien”

La sensual producción de Sofía Gonet en el backstage de Popstars

Ángel Di María fue a ver Rocky y se emocionó junto a Nico Vázquez: “Nunca hay que bajar los brazos”

La curiosa reacción de una participante de Gran Hermano al enterarse de que Paraguay no jugará la final del Mundial

INFOBAE AMÉRICA

Sismo de 7.4 sacude a Guatemala: Autoridades declaran alerta anaranjada por daños y descartan tsunami

El enigma del sueño largo: ¿por qué dormir demasiado podría advertir sobre el Alzheimer?

Un operativo deja 50 detenidos en uno de los sectores más concurridos de Quito

Noboa concentra la coordinación del Ejecutivo en seis nuevos gabinetes para reorganizar la gestión del Estado

Carlos Tenorio cuestionó a la FEF y pidió un proyecto deportivo antes de elegir al nuevo técnico de Ecuador

Temas Relacionados

Últimas Noticias

La educación se plantea qué hacer frente a la inteligencia artificial y define pautas de uso

La escuela de abogacía de la Universidad de Chicago estableció una estrategia: los estudiantes deben aprender a pensar de manera independiente sin apoyarse en la IA, pero también deben egresar listos para trabajar con instrumentos que ya están disponibles

Día internacional del emoji: ¿qué impacto pedagógico tienen en la comunicación?

Esta efeméride particular se celebra desde 2014 e invita a todos los usuarios de redes sociales, foros y mensajería instantánea a hablar un único lenguaje en común: el de los emojis, pero ¿es tan universal como se cree?

6 de cada 10 chicos de 8 años tienen celular: afirman que la prohibición escolar no garantiza mejores aprendizajes

Martín Nistal sobre las mejoras en las pruebas Aprender: “Deberíamos tener un consenso sobre los métodos de alfabetización que funcionan mejor”

El Salvador recibe un reconocimiento de la UNESCO por avances en la educación superior

La distinción fue anunciada por el subdirector general de Educación, Qun Chen, durante la apertura del II Congreso Internacional Modelo Educativo País en San Salvador, con participación de delegaciones de más de 45 países

DEPORTES

FIFA confirmó la indumentaria que vestirán Argentina y España en la gran final del Mundial 2026: el guiño a Qatar 2022 de la Scaloneta

Franco Colapinto terminó 7° en una segunda práctica del Gran Premio de Bélgica marcada por el accidente de Pierre Gasly

Qué dijo LeBron James sobre su salida de Los Angeles Lakers durante el evento Fanatics Fest NYC

La alegría de Franco Colapinto tras protagonizar una de sus mejores prácticas en Alpine: “Fue un gran día”

La tradición de los recientes títulos que repetirá la selección argentina en la última conferencia de prensa de Lionel Scaloni antes de la final del Mundial

TELESHOW

Benjamín Vicuña, Esteban Lamothe y una mirada particular sobre los mitos argentinos: “Eso no es verdad”

Pamela David habló de la salud de Daniel Vila tras su operación en Estados Unidos: “Salió todo muy bien”

La sensual producción de Sofía Gonet en el backstage de Popstars

Ángel Di María fue a ver Rocky y se emocionó junto a Nico Vázquez: “Nunca hay que bajar los brazos”

La curiosa reacción de una participante de Gran Hermano al enterarse de que Paraguay no jugará la final del Mundial

INFOBAE AMÉRICA

Sismo de 7.4 sacude a Guatemala: Autoridades declaran alerta anaranjada por daños y descartan tsunami

El enigma del sueño largo: ¿por qué dormir demasiado podría advertir sobre el Alzheimer?

Un operativo deja 50 detenidos en uno de los sectores más concurridos de Quito

Noboa concentra la coordinación del Ejecutivo en seis nuevos gabinetes para reorganizar la gestión del Estado

Carlos Tenorio cuestionó a la FEF y pidió un proyecto deportivo antes de elegir al nuevo técnico de Ecuador