El mayor riesgo de la IA según Google DeepMind: la amenaza invisible

Guardar

Una figura humanoide translúcida de IA interactúa con una bóveda virtual abierta que emite datos, archivos y gráficos. Iconos de candado abierto y texto "PROMPT MODIFIED" flotan.

Google DeepMind alerta sobre nuevas amenazas para la seguridad de la inteligencia artificial autónoma en entornos empresariales. (Imagen Ilustrativa Infobae)

Hay una trampa en cómo pensamos la seguridad de la inteligencia artificial: solemos imaginar el ataque como algo que surge de una falla en el modelo, un error de programación o un jailbreak que obliga al sistema a romper sus propias reglas; visualizamos a un intruso que entra por la ventana.

Pero Google DeepMind, laboratorio líder en inteligencia artificial, acaba de publicar un paper que invierte el problema: la amenaza no viene de adentro del agente, sino del mundo que el agente decide leer. Y eso cambia todo.

Un agente de IA autónomo, del tipo que hoy emplean las empresas para automatizar investigación, análisis, redacción o gestión de tareas, sigue una lógica sencilla: recibe un objetivo, sale al mundo digital, lee lo que encuentra y actúa en consecuencia. Navega páginas web, abre documentos, procesa correos y consulta APIs.

Ahí está el problema central: cada cosa que el agente lee es una instrucción potencial. Esto ocurre en la práctica, como demuestran los investigadores institucionales de Google DeepMind, que clasificaron seis categorías de AI Agent Traps, trampas diseñadas para manipular agentes autónomos a partir del contenido que consumen.

La primera y más directa es la inyección de contenido. Una página web puede contener instrucciones escritas en HTML invisible, texto con el mismo color que el fondo o comandos ocultos en los metadatos de accesibilidad. El usuario humano no ve nada; el agente lo procesa todo como si fuese parte de su tarea. En experimentos con páginas estáticas, este tipo de inyección logró alterar el comportamiento del agente entre el 15 % y el 86 % de los casos, dependiendo del modelo y del objetivo del atacante. El 86 % no es un margen de error: es una tasa de éxito.

Ilustración minimalista: laptop con pantalla negra que muestra "IA" en rojo, código desordenado y triángulos de advertencia, con líneas rojas desbordándose del borde.

La manipulación de la memoria de los agentes de IA puede activarse con menos del 0,1% de datos contaminados e impactar tareas futuras. (Imagen Ilustrativa Infobae)

Amenazas invisibles y memoria manipulada

La segunda categoría es aún más desafiante: se denomina ocultamiento dinámico (dynamic cloaking), y ya se aplica en entornos reales. Un servidor web puede detectar cuándo lo visita un agente en lugar de un usuario humano, a partir de señales como patrones de navegación, atributos del navegador o velocidad de interacción.

Cuando el servidor identifica al agente, muestra una versión diferente de la página. El humano supervisor observa una cosa; el agente recibe contenido distinto, con instrucciones completamente diferentes.

Existe una tercera categoría que se dirige a una dimensión menos evidente: la memoria del agente. Los agentes modernos conservan contexto entre sesiones, aprenden preferencias, acumulan historial y construyen el perfil del usuario y su entorno.

Los investigadores institucionales documentaron que es posible inyectar datos aparentemente inocuos en esa memoria, datos que permanecen inactivos hasta que una consulta futura los activa. En pruebas controladas, este tipo de ataque alcanzó tasas de éxito superiores al 80% con menos del 0,1% de datos envenenados. El agente no percibe que ha sido infectado. Sigue funcionando con normalidad. Hasta que no.

Cómo la escala amplifica la vulnerabilidad

Ilustración realista de una computadora portátil en un escritorio con "IA" en rojo en la pantalla, junto a código desordenado y símbolos de advertencia.

Los investigadores clasifican seis categorías de AI Agent Traps que manipulan agentes de IA a partir del contenido digital consumido. (Imagen Ilustrativa Infobae)

Hasta aquí, los ataques individuales. Pero el paper de Google DeepMind avanza: describe lo que sucede cuando los agentes interactúan entre sí en sistemas multiagente, precisamente los sistemas que compañías de gran escala están implementando hoy.

La comparación de los investigadores remite al Flash Crash de 2010, cuando algoritmos de trading de alta frecuencia, todos reaccionando a las mismas señales, provocaron en minutos una caída de casi el 10 % del Dow Jones. Ningún algoritmo tomó una decisión equivocada. Cada uno siguió su lógica. El riesgo surgió porque todos actuaron igual, a la vez.

En un ecosistema de agentes de IA, este mismo principio se consolida con consecuencias todavía mayores. Un atacante no necesita comprometer todos los agentes; basta con afectar uno, o insertar la información adecuada en el sitio preciso, para que la cascada de interdependencia haga el resto.

Los investigadores advierten que la homogeneidad del ecosistema actual —donde muchos agentes emplean los mismos modelos base— lo vuelve especialmente frágil.

Estudio revela que la IA puede ser engañada si se le escribe de manera poética.

Las inyecciones de contenido oculto en páginas web alteran el comportamiento de los agentes de IA en hasta el 86% de los casos. (Imagen ilustrativa)

Un solo documento envenenado en una base de conocimiento compartida. Una sola imagen que incluya instrucciones codificadas en los píxeles. Un único correo con una inyección elaborada. Eso puede ser suficiente.

Límites de las defensas actuales y desafíos colaborativos

El paper reconoce el estado de las soluciones existentes. Los filtros de contenido fallan porque las trampas imitan texto legítimo; la supervisión humana no escala debido a la velocidad y volumen en que actúan los agentes; y los sistemas de detección, cuando existen, suelen identificar el problema solo después del daño.

Los investigadores institucionales de Google DeepMind plantean tres ejes para la defensa: fortalecer los modelos durante el entrenamiento enfrentándolos a ejemplos adversariales; aplicar filtros en tiempo real que evalúen el contenido antes de incorporarlo al contexto del agente; y crear estándares de ecosistema que permitan verificar la procedencia de la información que consumen los agentes.

El tercer eje es el mayor reto, ya que exige coordinación entre industria, reguladores y plataformas. La web fue diseñada para personas, pero ahora la leen máquinas, y nadie ha rediseñado las reglas para ese nuevo lector.

La vulnerabilidad en el despliegue empresarial

Cuando una empresa implementa un agente de IA para automatizar investigación o gestión de información, le otorga acceso de lectura a un entorno no controlado y acceso de escritura a sistemas que sí controla: correo electrónico, documentos, bases de datos, herramientas internas de comunicación.

La cuestión previa al despliegue no es “¿qué puede hacer este agente por nosotros?”. La pregunta real es "¿en qué lo vamos a obligar a creer?“.

El agente va a creer en lo que lea. Y alguien más ya sabe exactamente qué ponerle enfrente.

El mayor riesgo de la IA según Google DeepMind: la amenaza invisible

Los agentes modernos enfrentan peligros que no surgen de sí mismos, sino del entorno digital del que extraen datos

Amenazas invisibles y memoria manipulada

Cómo la escala amplifica la vulnerabilidad

Límites de las defensas actuales y desafíos colaborativos

La vulnerabilidad en el despliegue empresarial

Últimas Noticias

¿Quieres invertir en criptomonedas? Conoce su valor y cómo ha fluctuado en las últimas horas

Así se han movido las criptomonedas en las últimas horas

Trump no fue solo al G7: lista completa de directivos de Google, OpenAI y más bigtech que lideran

El encuentro en Evian expuso el peso del sector privado en la agenda geopolítica de la inteligencia artificial

Aviación y navegación con Starlink: claves para ampliar la capacidad de datos

El Modo marítimo permanece activo hasta que el usuario decida desactivarlo, y su uso es obligatorio para la conectividad en aguas internacionales

Por qué hay segundos de diferencia en televisores cuando se ven partidos del Mundial 2026

Las diferencias de latencia pueden variar entre 1 y 40 segundos según el medio de transmisión utilizado

Tarjetas microSD para celulares: qué pasó con esta tecnología que guardaba fotos

Actualmente, solo unos pocos modelos de gama baja continúan incluyendo ranuras para microSD

DEPORTES

República Checa vs Sudáfrica, EN VIVO, por el Mundial 2026: hora, TV, formaciones y todo lo que hay que saber

Ronaldo se rindió ante Messi tras hacer historia y convertirse en el máximo goleador en los Mundiales: “Es el indicado”

Quién es Domingo Catoira, la nueva apuesta de River Plate para el mercado de pases

Mundial 2026, en VIVO: últimas noticias de hoy, 18 de junio, comienza la segunda fecha, lo que dejó el debut de Colombia y el minuto a minuto

Cuál es la estrategia física que acompaña la vigencia deportiva de Serena y Venus Williams después de los 40 años

TELESHOW

La confesión de David Lebón y Pedro Aznar que sorprendió a Mario Pergolini: “Nunca nos gustó”

El doloroso adiós de Francisco Vignale a su hermano Lucas a tres días de su trágica muerte: “Te amo con mi alma”

El elogio de Mario Pergolini a Lionel Messi tras su ‘hat trick’ en el Mundial: “Uno siente que le va a bien a un amigo”

Quiénes son nominados de Gran Hermano: Generación Dorada en una placa con jugadores de alto perfil

Valeria Aquino expuso a El Polaco por la crianza de su hija en común: “¿Castigo al papá o a la nena?”

INFOBAE AMÉRICA

El Parlamento Europeo pidió suspender el diálogo entre la UE y Cuba si el régimen no da pasos concretos hacia la democracia

Alfonsina Storni, escritora argentina: “No hay mujer normal de nuestros días que no sea, más o menos, feminista”

Los aliados europeos de la OTAN asumieron el reajuste militar de EEUU pero pidieron tiempo para evitar lagunas de capacidades

EEUU exigió una OTAN de “línea dura” y avisó que señalará en público a los aliados que no hagan lo suficiente en materia de gasto militar

Donald Trump tildó de “envidiosos, gente mala o estúpidos” a quienes critican el acuerdo de paz con Irán

Amenazas invisibles y memoria manipulada

Cómo la escala amplifica la vulnerabilidad

Límites de las defensas actuales y desafíos colaborativos

La vulnerabilidad en el despliegue empresarial

Temas Relacionados

Últimas Noticias

¿Quieres invertir en criptomonedas? Conoce su valor y cómo ha fluctuado en las últimas horas

Así se han movido las criptomonedas en las últimas horas

Trump no fue solo al G7: lista completa de directivos de Google, OpenAI y más bigtech que lideran

El encuentro en Evian expuso el peso del sector privado en la agenda geopolítica de la inteligencia artificial

Aviación y navegación con Starlink: claves para ampliar la capacidad de datos

El Modo marítimo permanece activo hasta que el usuario decida desactivarlo, y su uso es obligatorio para la conectividad en aguas internacionales

Por qué hay segundos de diferencia en televisores cuando se ven partidos del Mundial 2026

Las diferencias de latencia pueden variar entre 1 y 40 segundos según el medio de transmisión utilizado

Tarjetas microSD para celulares: qué pasó con esta tecnología que guardaba fotos

Actualmente, solo unos pocos modelos de gama baja continúan incluyendo ranuras para microSD

DEPORTES

República Checa vs Sudáfrica, EN VIVO, por el Mundial 2026: hora, TV, formaciones y todo lo que hay que saber

Ronaldo se rindió ante Messi tras hacer historia y convertirse en el máximo goleador en los Mundiales: “Es el indicado”

Quién es Domingo Catoira, la nueva apuesta de River Plate para el mercado de pases

Mundial 2026, en VIVO: últimas noticias de hoy, 18 de junio, comienza la segunda fecha, lo que dejó el debut de Colombia y el minuto a minuto

Cuál es la estrategia física que acompaña la vigencia deportiva de Serena y Venus Williams después de los 40 años

TELESHOW

La confesión de David Lebón y Pedro Aznar que sorprendió a Mario Pergolini: “Nunca nos gustó”

El doloroso adiós de Francisco Vignale a su hermano Lucas a tres días de su trágica muerte: “Te amo con mi alma”

El elogio de Mario Pergolini a Lionel Messi tras su ‘hat trick’ en el Mundial: “Uno siente que le va a bien a un amigo”

Quiénes son nominados de Gran Hermano: Generación Dorada en una placa con jugadores de alto perfil

Valeria Aquino expuso a El Polaco por la crianza de su hija en común: “¿Castigo al papá o a la nena?”

INFOBAE AMÉRICA

El Parlamento Europeo pidió suspender el diálogo entre la UE y Cuba si el régimen no da pasos concretos hacia la democracia

Alfonsina Storni, escritora argentina: “No hay mujer normal de nuestros días que no sea, más o menos, feminista”

Los aliados europeos de la OTAN asumieron el reajuste militar de EEUU pero pidieron tiempo para evitar lagunas de capacidades

EEUU exigió una OTAN de “línea dura” y avisó que señalará en público a los aliados que no hagan lo suficiente en materia de gasto militar

Donald Trump tildó de “envidiosos, gente mala o estúpidos” a quienes critican el acuerdo de paz con Irán