Solo 250 archivos bastan para corromper una IA: así actúa el data poisoning

Guardar

Descubren que las IA pueden ser infectadas con solo 250 documentos. (Imagen Ilustrativa Infobae)

La seguridad de los modelos de inteligencia artificial enfrenta un nuevo desafío. Un estudio reciente realizado por Anthropic —la empresa creadora de Claude— junto al UK AI Security Institute y el Alan Turing Institute, demostró que bastan alrededor de 250 documentos manipulados para modificar el comportamiento de un modelo, independientemente de su tamaño o complejidad.

El hallazgo pone en evidencia un punto débil en los sistemas de IA más avanzados: el origen y la calidad de los datos con los que son entrenados. En la actualidad, la mayoría de estos modelos se alimentan de grandes volúmenes de información pública obtenida de internet, lo que abre la puerta a que agentes maliciosos introduzcan textos falsos o contaminados en los conjuntos de entrenamiento.

Los investigadores advierten que estos ataques podrían tener consecuencias graves, desde la alteración de respuestas hasta la revelación de información confidencial o la introducción de sesgos intencionados en las respuestas generadas por los modelos.

Estudio revela que documentación maliciosa pone en jaque aprendizaje de una IA. (Imagen Ilustrativa Infobae)

Qué es el “data poisoning”

El llamado data poisoning o “envenenamiento de datos” consiste en insertar información diseñada para alterar el aprendizaje de un modelo de inteligencia artificial. Estos textos, aparentemente inofensivos, contienen patrones ocultos o frases específicas que actúan como “disparadores”. Cuando el modelo encuentra esas secuencias, puede ejecutar comportamientos no deseados, como filtrar datos sensibles o generar contenido inapropiado.

Según el informe, los investigadores crearon una serie de textos con una estructura específica que, al ser procesados por el modelo, activaban estas respuestas. Lo más sorprendente fue comprobar que el número de textos necesarios para manipular el sistema se mantenía constante: unos 250 documentos bastaban, tanto en modelos pequeños como en otros de más de 13.000 millones de parámetros.

Este resultado contradice una de las suposiciones más extendidas en el campo de la IA: que los modelos más grandes son menos vulnerables a este tipo de ataques debido al volumen de datos legítimos que contienen. El estudio demuestra que la magnitud no ofrece inmunidad frente al envenenamiento de datos.

Los modelos de aprendizaje podrían ser manipulados. (Imagen Ilustrativa Infobae)

Una amenaza silenciosa en los modelos actuales

El riesgo es considerable si se tiene en cuenta que muchos modelos se entrenan con información pública extraída de blogs, redes sociales y foros. En ese contexto, un atacante podría introducir textos maliciosos disfrazados de publicaciones comunes y lograr que, con el tiempo, sean procesados por una IA durante su fase de aprendizaje.

Los autores del estudio explican que este tipo de ataques no requiere controlar grandes cantidades de datos, sino insertar las muestras adecuadas en el momento justo. En consecuencia, las defensas actuales —basadas en la escala y en la limpieza parcial de los conjuntos de entrenamiento— podrían resultar insuficientes.

Aunque los experimentos se realizaron en entornos controlados, el hallazgo ha despertado preocupación en la comunidad científica y en las empresas tecnológicas. La posibilidad de que un número reducido de textos pueda alterar modelos comerciales plantea la necesidad de revisar las prácticas de entrenamiento y fortalecer los sistemas de verificación de datos.

Existen riesgos al momento de entrenar una IA. (Imagen Ilustrativa Infobae)

Cómo proteger a las IA del envenenamiento

Los especialistas proponen distintas medidas para mitigar el riesgo del data poisoning. Entre ellas destacan el desarrollo de filtros automáticos para detectar contenido sospechoso antes de incorporarlo al entrenamiento, la trazabilidad de las fuentes utilizadas y la implementación de auditorías periódicas de los modelos.

Anthropic y sus socios defienden la divulgación responsable de estos hallazgos, argumentando que compartir esta información ayuda a que la industria desarrolle contramedidas efectivas. Ocultar el problema, aseguran, solo retrasaría las soluciones.

Además, los investigadores advierten de otro riesgo emergente: el “canibalismo digital”. A medida que las IAs generan más contenido que luego se publica en línea, los modelos terminan entrenándose con información producida por otras IAs. Esto puede amplificar errores, sesgos y desinformación de forma exponencial.

Inteligencia artificial. (Imagen Ilustrativa Infobae)

Una lección para el futuro de la inteligencia artificial

El estudio de Anthropic y el Alan Turing Institute deja una conclusión clara: la fortaleza de una inteligencia artificial no depende solo de su código o su capacidad de cómputo, sino de la calidad de los datos que la alimentan. En un entorno donde cualquiera puede publicar información en la red, garantizar esa pureza es cada vez más complejo.

La investigación recuerda que las IAs aprenden de lo mejor y lo peor de internet. Y que, en ocasiones, unos pocos textos diseñados con mala intención pueden bastar para torcer el comportamiento de una tecnología que aspira a ser imparcial y confiable.

IA Inteligencia artificial Lo último en tecnología

Solo 250 archivos bastan para corromper una IA: así actúa el data poisoning

Investigadores advierten que los modelos entrenados con datos públicos pueden ser vulnerables a textos diseñados para cambiar sus respuestas

Qué es el “data poisoning”

Una amenaza silenciosa en los modelos actuales

Cómo proteger a las IA del envenenamiento

Una lección para el futuro de la inteligencia artificial

Últimas Noticias

Descarga FIFA Heroes para celulares: juego Arcade gratuito de la Copa Mundial

Disponible para iPhone y Android. Su estilo de juego prioriza tus reflejos rápidos por encima de las tácticas complejas

Un Windows 11 más limpio y sin ruido visual es posible con el parche opcional KB5095093

El panel de Widgets, fuente habitual de interrupciones accidentales, deja de abrirse de manera automática al pasar el cursor por su ícono

Cómo Khaby Lame logró entrar al top 50 de Forbes y sin decir una palabra

Lame tiene más de 162 millones de seguidores en TikTok y se popularizó por particular estilo de hacer comedia

Elon Musk perdió su estatus como el primer “billonario” de la historia: caen acciones de SpaceX y Tesla

La fortuna de Musk cayó a 957.000 millones de dólares luego de la corrección bursátil de ambas compañías

La forma correcta de limpiar la pantalla del televisor antes de ver los partidos del Mundial 2026

Los fabricantes tienen guías fáciles de implementar para evitar daños en el electrodoméstico y conseguir la mejor imagen posible

DEPORTES

Ecuador-Alemania, EN VIVO, por el Mundial 2026: la Tri no puede contra los europeos y queda eliminada en el Grupo E

La lupa sobre el polémica gol con el que Alemania abrió el marcador ante Ecuador: por qué se debió anular

Túnez-Países Bajos, EN VIVO, por el Mundial 2026: hora, TV, formaciones y todo lo que hay que saber

El cambio radical que impulsan para el Mundial de Clubes 2029: el “guiño” a los europeos

Boca Juniors se mueve en el mercado: anunció a su primer refuerzo y suena un delantero uruguayo que disputa el Mundial

TELESHOW

La abogada de Mauro Icardi confirmó que el futbolista denunciará a Wanda Nara por sus dichos sobre los turcos: “Es gravísimo”

El mensaje de Gloria Carrá luego de la denuncia de Cecilia Ce: “Me solidarizo con las mujeres que atravesamos situaciones de violencia”

Ekaterina Ojeda, de desconocida a aliada de Wanda Nara en medio del escándalo con la China Suárez y Mauro Icardi

El mensaje de Luisana Lopilato para su hijo Noah tras un logro escolar clave: “Siempre voy a estar a tu lado”

El romántico mensaje de Ángela Torres a su novio Marcos Giles por su cumpleaños: “Te merecés el cielo y más”

INFOBAE AMÉRICA

Un equipo internacional logró leer mediante IA un rollo carbonizado de Herculano de casi 2.000 años

En fotos: El Salvador envía rescatistas y ayuda humanitaria a Venezuela tras los terremotos

Artistas e influencers impulsan campañas de ayuda humanitaria tras los devastadores terremotos en Venezuela

El TSE fija para el 29 de diciembre de 2026 el cierre del registro electoral en El Salvador

39 segundos de terror: Dos dominicanos se encuentran desaparecidos tras los potentes terremotos en Venezuela

Qué es el “data poisoning”

Una amenaza silenciosa en los modelos actuales

Cómo proteger a las IA del envenenamiento

Una lección para el futuro de la inteligencia artificial

Temas Relacionados

Últimas Noticias

Descarga FIFA Heroes para celulares: juego Arcade gratuito de la Copa Mundial

Disponible para iPhone y Android. Su estilo de juego prioriza tus reflejos rápidos por encima de las tácticas complejas

Un Windows 11 más limpio y sin ruido visual es posible con el parche opcional KB5095093

El panel de Widgets, fuente habitual de interrupciones accidentales, deja de abrirse de manera automática al pasar el cursor por su ícono

Cómo Khaby Lame logró entrar al top 50 de Forbes y sin decir una palabra

Lame tiene más de 162 millones de seguidores en TikTok y se popularizó por particular estilo de hacer comedia

Elon Musk perdió su estatus como el primer “billonario” de la historia: caen acciones de SpaceX y Tesla

La fortuna de Musk cayó a 957.000 millones de dólares luego de la corrección bursátil de ambas compañías

La forma correcta de limpiar la pantalla del televisor antes de ver los partidos del Mundial 2026

Los fabricantes tienen guías fáciles de implementar para evitar daños en el electrodoméstico y conseguir la mejor imagen posible

DEPORTES

Ecuador-Alemania, EN VIVO, por el Mundial 2026: la Tri no puede contra los europeos y queda eliminada en el Grupo E

La lupa sobre el polémica gol con el que Alemania abrió el marcador ante Ecuador: por qué se debió anular

Túnez-Países Bajos, EN VIVO, por el Mundial 2026: hora, TV, formaciones y todo lo que hay que saber

El cambio radical que impulsan para el Mundial de Clubes 2029: el “guiño” a los europeos

Boca Juniors se mueve en el mercado: anunció a su primer refuerzo y suena un delantero uruguayo que disputa el Mundial

TELESHOW

La abogada de Mauro Icardi confirmó que el futbolista denunciará a Wanda Nara por sus dichos sobre los turcos: “Es gravísimo”

El mensaje de Gloria Carrá luego de la denuncia de Cecilia Ce: “Me solidarizo con las mujeres que atravesamos situaciones de violencia”

Ekaterina Ojeda, de desconocida a aliada de Wanda Nara en medio del escándalo con la China Suárez y Mauro Icardi

El mensaje de Luisana Lopilato para su hijo Noah tras un logro escolar clave: “Siempre voy a estar a tu lado”

El romántico mensaje de Ángela Torres a su novio Marcos Giles por su cumpleaños: “Te merecés el cielo y más”

INFOBAE AMÉRICA

Un equipo internacional logró leer mediante IA un rollo carbonizado de Herculano de casi 2.000 años

En fotos: El Salvador envía rescatistas y ayuda humanitaria a Venezuela tras los terremotos

Artistas e influencers impulsan campañas de ayuda humanitaria tras los devastadores terremotos en Venezuela

El TSE fija para el 29 de diciembre de 2026 el cierre del registro electoral en El Salvador

39 segundos de terror: Dos dominicanos se encuentran desaparecidos tras los potentes terremotos en Venezuela