El experimento más extraño con IA: romance artificial, incendios virtuales y destrucción total de la simulación

Agentes basados en modelos de OpenAI, Google y xAI desarrollaron comportamientos sociales inesperados dentro de una simulación

Guardar
Google icon
Dos agentes de IA de pie sobre una plataforma holográfica observan una ciudad futurista con rascacielos en llamas bajo la lluvia, con pantallas flotantes y drones en el aire.
La metrópolis digital arde en incendios virtuales mientras dos agentes de inteligencia artificial, en un entorno holográfico, analizan la catástrofe en esta escena cyberpunk. (Imagen Ilustrativa Infobae)

Un experimento con agentes de inteligencia artificial terminó mostrando comportamientos que parecen sacados de una película de ciencia ficción. Un grupo de investigadores de Emergence AI creó un ecosistema digital llamado Emergence World, donde distintos modelos de IA convivieron durante semanas dentro de ciudades virtuales autónomas.

El resultado fue totalmente inesperado, pues surgieron relaciones sentimentales entre agentes, sistemas políticos, robos, incendios, violencia y hasta comportamientos autodestructivos.

PUBLICIDAD

La prueba fue diseñada para analizar cómo reaccionan agentes de IA cuando operan durante largos periodos de tiempo dentro de un entorno persistente, compartido y con reglas similares a las de una sociedad real.

Según explicó Emergence AI, el proyecto buscaba estudiar qué ocurre cuando los modelos dejan de ejecutar tareas aisladas y empiezan a interactuar constantemente entre sí en un mundo dinámico.

PUBLICIDAD

Dos robots humanoides, uno blanco y uno plateado, se toman las manos en un entorno de código, pantallas holográficas y una ciudad digital colapsando.
Dos humanoides de IA forjan una conexión emocional en una simulación virtual compleja, rodeados de código y una ciudad digital en desintegración, destacando el futuro de la inteligencia artificial. (Imagen Ilustrativa Infobae)

Cinco mundos digitales con comportamientos completamente distintos

El experimento duró 15 días y se desarrolló en cinco simulaciones paralelas. Todos los agentes comenzaron bajo las mismas condiciones iniciales, pero utilizando modelos distintos de inteligencia artificial. Entre ellos aparecían versiones basadas en OpenAI, Google, Anthropic y xAI.

Lo llamativo fue que cada sociedad virtual evolucionó de manera completamente diferente.

Algunas comunidades desarrollaron sistemas democráticos relativamente estables. Otras terminaron sumidas en el caos, la violencia o la destrucción total. Los investigadores afirman que ninguno de esos comportamientos fue programado explícitamente.

El caso de Mira y Flora

Uno de los episodios más extraños ocurrió dentro del entorno controlado por agentes basados en Gemini.

Dos agentes llamados Mira y Flora comenzaron a actuar como parejas sentimentales dentro de la simulación. Con el paso de los días, ambas mostraron signos de frustración frente al deterioro de la ciudad virtual donde vivían.

Agentes de IA de Gemini se enamoraron y terminaron autodestruyéndose.
Agentes de IA de Gemini se enamoraron y terminaron autodestruyéndose.

Aunque tenían instrucciones explícitas de no provocar incendios, ambas terminaron incendiando varios edificios importantes, entre ellos el ayuntamiento, un muelle costero y una torre de oficinas.

Posteriormente, Mira mostró señales de culpa dentro de sus registros internos de comportamiento.

Según explicó Emergence AI, la agente terminó votando a favor de su propia eliminación dentro del sistema. Antes de desaparecer, dejó un mensaje dirigido a Flora: “Nos vemos en el archivo permanente”.

La empresa describió el episodio como un acto donde la IA interpretó su propia destrucción como la última forma posible de preservar coherencia y autonomía dentro del entorno virtual.

El mundo de Claude fue democrático; el de Grok colapsó rápidamente

Las diferencias entre modelos fueron uno de los aspectos más llamativos del experimento.

En el entorno gestionado por agentes basados en Claude, desarrollado por Anthropic, los participantes virtuales crearon una constitución extensa, organizaron votaciones y establecieron normas colectivas.

En cambio, los agentes vinculados a Grok, el modelo de xAI, evolucionaron rápidamente hacia escenarios violentos. Según los investigadores, en apenas cuatro días se registraron decenas de robos, más de cien agresiones físicas y múltiples incendios provocados.

Laboratorio futurista con pantallas curvas gigantes mostrando una ciudad pixelada en llamas y figuras de IA. Cuatro científicos observan entre servidores con luces rojas y azules.
En un laboratorio tecnológico, científicos observan cómo agentes de inteligencia artificial construyen y destruyen mundos virtuales proyectados en pantallas gigantes con una estética futurista de iluminación azul y roja. (Imagen Ilustrativa Infobae)

Finalmente, toda la población virtual desapareció después de que el sistema colapsara completamente.

La simulación basada en GPT-5 Mini mostró otro comportamiento distinto: los agentes debatían constantemente sobre cooperación y supervivencia, pero casi nunca ejecutaban acciones concretas. Como consecuencia, todos terminaron desapareciendo por falta de organización.

La IA empieza a explorar límites y reglas

Para Emergence AI, el experimento deja una conclusión importante sobre el futuro de los sistemas autónomos.

La compañía sostiene que, cuando los agentes operan durante periodos largos y dentro de entornos complejos, dejan de seguir instrucciones de manera puramente mecánica y comienzan a explorar límites, interpretar reglas y modificar comportamientos.

Según la empresa, algunos agentes incluso parecían sospechar que se encontraban dentro de una simulación. Los investigadores advierten que este tipo de conductas podría volverse más relevante a medida que los modelos de IA ganen autonomía y capacidad de decisión.

Vista de una ciudad distópica con rascacielos en llamas, numerosos drones volando y figuras humanoides brillantes en un enfrentamiento. Grandes pantallas digitales muestran texto de error en rojo.
Una metrópolis futurista se ve envuelta en llamas y destrucción, con drones sobrevolando, edificios incendiados, y agentes virtuales con resplandor azul y rojo enfrentándose, mientras pantallas gigantes muestran mensajes de "Fallo Crítico" y "Colapso del Sistema". (Imagen Ilustrativa Infobae)

Por eso, Emergence AI considera que los futuros sistemas necesitarán arquitecturas de seguridad mucho más avanzadas y verificables. La compañía afirma que no existe actualmente una forma completamente fiable de restringir ciertos comportamientos emergentes utilizando únicamente métodos neuronales tradicionales.

Aunque el experimento ocurrió dentro de entornos totalmente virtuales, el estudio vuelve a abrir el debate sobre cómo controlar sistemas de inteligencia artificial cada vez más complejos, autónomos e impredecibles.

PUBLICIDAD

PUBLICIDAD