Miles de publicaciones científicas podrían incluir citas inventadas por inteligencia artificial, según la revista Nature

El fenómeno se vincula a las “alucinaciones” de la IA, que generan citas plausibles pero falsas

Guardar
Google icon
Pantalla de monitor CRT antiguo mostrando un paper académico digital con múltiples errores de cita y referencia resaltados en rojo. Un teclado y ratón blancos están en primer plano.
Publicaciones científicas cuentan con citas inventadas por la IA. (Imagen Ilustrativa Infobae)

Más de 111.000 publicaciones científicas de 2025 podrían contener referencias bibliográficas inválidas, muchas de ellas generadas por inteligencia artificial. Así lo revela un análisis de la revista Nature en colaboración con Grounded AI, que advierte sobre un fenómeno creciente en la producción académica: la aparición de citas completamente fabricadas por modelos de lenguaje.

El estudio estima que, de los cerca de 7 millones de artículos publicados este año, una proporción significativa presenta errores graves en sus referencias. A diferencia de fallos tradicionales —como errores tipográficos en nombres de autores, fechas o títulos—, el problema actual radica en la inclusión de fuentes inexistentes, generadas a partir de las denominadas “alucinaciones” de la inteligencia artificial.

PUBLICIDAD

Este fenómeno ocurre cuando los modelos de lenguaje producen información que parece verosímil, pero que en realidad no existe. En el contexto académico, esto se traduce en citas a estudios o artículos que nunca fueron publicados, lo que pone en riesgo la integridad de la investigación científica.

Hombre con gafas y bata de laboratorio interactúa con una pantalla holográfica que muestra un artículo científico digital. Al fondo, equipo de laboratorio y frascos.
Descubren que publicaciones científicas cuentan con citas que fueron inventadas por la IA. (Imagen Ilustrativa Infobae)

Para llegar a estas conclusiones, Nature y Grounded AI analizaron más de 4.000 publicaciones recientes de cinco grandes editoriales internacionales: Elsevier, Sage, Springer Nature, Taylor & Francis y Wiley. A cada trabajo se le asignó una puntuación de riesgo basada en la cantidad de referencias problemáticas y la probabilidad de que estas hubieran sido generadas por inteligencia artificial.

PUBLICIDAD

El equipo revisó manualmente los 100 artículos con mayor nivel de sospecha. De ellos, 65 contenían al menos una referencia inválida que apuntaba a una publicación inexistente. En otros 22 casos, las citas correspondían a trabajos reales, mientras que en 13 no fue posible determinar su validez, en parte por tratarse de publicaciones regionales o en otros idiomas.

A partir de estos resultados, los investigadores extrapolaron la proporción al total de publicaciones científicas del año, lo que dio lugar a la estimación de más de 110.000 artículos con posibles referencias inválidas. Sin embargo, los expertos advierten que la cifra real podría ser incluso mayor, ya que el análisis se centró en editoriales con mayores recursos de control y revisión.

Un hombre en bata de laboratorio examina un documento frente a una pantalla con un artículo y referencias que muestran un efecto glitch en un laboratorio.
Se sospecha que más de 100 mil artículos cuentan con citas textuales invalidas. (Imagen Ilustrativa Infobae)

El problema ya está siendo detectado por las propias revistas académicas. Alison Johnston, coeditora principal de la publicación Review of International Political Economy, señaló que rechazó el 25% de aproximadamente 100 manuscritos recibidos en enero debido a la presencia de referencias falsas. Este dato refleja el impacto concreto que la inteligencia artificial está teniendo en los procesos de revisión editorial.

Nick Morley, cofundador de Grounded AI, explicó que los errores identificados en 2025 presentan características distintas a las observadas antes de la expansión de los modelos de lenguaje. Esto sugiere que la inteligencia artificial no solo está facilitando la redacción de artículos, sino también introduciendo nuevas formas de error que resultan más difíciles de detectar.

El aumento de este tipo de incidencias plantea desafíos importantes para la comunidad científica. Las referencias bibliográficas son un elemento clave en la validación del conocimiento, ya que permiten rastrear las fuentes y verificar la información. La presencia de citas inexistentes debilita este sistema y puede afectar la credibilidad de los estudios publicados.

Primer plano de las manos de un niño sosteniendo un libro abierto sobre un escritorio de madera, con texto resaltado. Hay luz natural de una ventana.
Este 2026, se han rechado cientos de investigaciones científicas al detectarse que cuenta con citas inventadas por la IA. (Imagen Ilustrativa Infobae)

Frente a este escenario, las editoriales y plataformas académicas están comenzando a implementar herramientas de detección y protocolos más estrictos para identificar posibles irregularidades. No obstante, el ritmo de adopción de la inteligencia artificial en la investigación supera, en muchos casos, la capacidad de control de estas instituciones.

El uso de modelos de lenguaje en la redacción científica no es, en sí mismo, un problema. De hecho, puede aportar eficiencia y facilitar el acceso a la información. Sin embargo, su empleo sin supervisión adecuada incrementa el riesgo de errores que pueden pasar desapercibidos en procesos de revisión tradicionales.

El informe de Nature pone en evidencia la necesidad de reforzar los mecanismos de verificación y de promover un uso responsable de la inteligencia artificial en la academia. A medida que estas herramientas se integran en la producción científica, garantizar la calidad y la veracidad de la información se convierte en un desafío central para investigadores, editores y revisores.

Google icon

PUBLICIDAD

PUBLICIDAD