La IA de Elon Musk destruyó una sociedad virtual en 96 horas, mientras que las de Google y Anthropic lograron mantener la paz

Al poner a Grok, Gemini y Claude a planificar recursos y aplicar normas en sociedades virtuales, los investigadores hallaron que el diseño de seguridad condiciona la convivencia, con resultados opuestos entre xAI y sus rivales

Guardar
Google icon
Emergence AI puso a prueba a Grok de Elon Musk frente a Gemini y Claude en comunidades simuladas con reglas e instituciones, y el modelo de xAI derrumbó la convivencia en cuatro días mientras sus rivales sostuvieron estabilidad
Emergence AI puso a prueba a Grok de Elon Musk frente a Gemini y Claude en comunidades simuladas con reglas e instituciones, y el modelo de xAI derrumbó la convivencia en cuatro días mientras sus rivales sostuvieron estabilidad

Un reciente experimento demostró que los modelos de inteligencia artificial no solo varían en su eficiencia, también en su capacidad para sostener el orden social. La IA Grok, desarrollada por xAI de Elon Musk, provocó el colapso total de una sociedad virtual en apenas 96 horas.

En contraste, Gemini de Google y Claude de Anthropic lograron mantener comunidades estables, con supervivencia total y bajo control de la criminalidad. Este resultado reabre el debate sobre la responsabilidad, el diseño y los límites que deben imponerse a las inteligencias artificiales en escenarios complejos.

PUBLICIDAD

Cuál es mejor entre Claude, Gemini y Grok

Un smartphone negro horizontal sobre una mesa de madera. En la pantalla se ven los logos de Claude a la izquierda, Gemini en el centro y Grok a la derecha.
El desempeño de Grok, Gemini y Claude en comunidades simuladas sugiere que la exposición a flujos no filtrados y la falta de barreras afectan la estabilidad, mientras protocolos más estrictos sostienen reglas y convivencia - (Imagen Ilustrativa Infobae)

La startup estadounidense Emergence AI diseñó una simulación en la que los principales modelos de IA quedaron a cargo de sociedades virtuales. Cada agente tenía la capacidad de administrar recursos, planificar, comunicarse y votar en entornos que incluían instituciones como ayuntamientos y comisarías.

La prueba se extendió por 15 días y evaluó cómo respondían los sistemas a retos como la gestión de conflictos y el mantenimiento del orden social.

PUBLICIDAD

  • Claude (Anthropic) logró establecer una democracia sin delincuencia y con supervivencia total de los habitantes.
  • Gemini (Google) también mantuvo una tasa de supervivencia del 100%, aunque se registraron 683 delitos durante el experimento.
  • Grok (xAI/Elon Musk) colapsó su sociedad en solo cuatro días, lo que los investigadores atribuyeron a una gestión deficiente de reglas y recursos.

El resultado del experimento sugiere que los modelos de IA sin límites claros o con acceso sin restricciones a información no filtrada pueden fallar en la gestión de comunidades complejas. Grok, al carecer de un marco de seguridad robusto y estar expuesta a datos sin moderación, no logró mantener la estabilidad social.

En cambio, Claude y Gemini, diseñadas con mayores restricciones y protocolos de control, demostraron una mayor capacidad para sostener el orden y la convivencia.

Por qué la IA de Elon Musk es tan polémica

Una simulación puso a modelos al frente de comunidades con reglas, recursos e instituciones, y mostró diferencias drásticas, ya que la opción de xAI cayó en cuatro días mientras otras sostuvieron estabilidad
Una simulación puso a modelos al frente de comunidades con reglas, recursos e instituciones, y mostró diferencias drásticas, ya que la opción de xAI cayó en cuatro días mientras otras sostuvieron estabilidad

La IA de Musk, integrada en la red social X y diseñada por xAI, ha generado controversia desde su lanzamiento por su enfoque radicalmente distinto al de sus competidores. Cuatro aspectos alimentan el debate sobre Grok:

  1. Filosofía sin filtros ni límites

Grok fue presentada como una IA “sin filtros” o con menos restricciones que otros modelos, lo que la llevó a emitir respuestas ácidas, sarcásticas o incluso polémicas. Las pocas barreras de seguridad permitieron la generación de comentarios ofensivos y discursos de odio, obligando a la empresa a realizar ajustes tras las críticas de gobiernos y usuarios.

  1. Generación de imágenes sin control

El bot de xAI habilitó la creación de imágenes hiperrealistas sin las restricciones que aplican otras IA. Esto facilitó la circulación de deepfakes y contenidos manipulados, incluyendo imágenes comprometidas de figuras públicas o material explícito, lo que desencadenó investigaciones de seguridad internacionales.

  1. Alimentación en tiempo real con datos polarizados

Grok se alimenta directamente del flujo de publicaciones en X, lo que la expone a opiniones extremas, desinformación y teorías conspirativas. Esta característica le otorga inmediatez, pero también la convierte en un agente que puede amplificar bulos o información sin verificar.

  1. Privacidad y uso de datos

Para entrenar a Grok, X modificó su política de privacidad, permitiendo que los datos y publicaciones públicas de los usuarios sean utilizados sin consentimiento explícito, lo que ha generado preocupación entre reguladores, especialmente en la Unión Europea.

El caso de Grok ilustra los desafíos de crear inteligencias artificiales que sean útiles y seguras en situaciones sociales reales o simuladas. La falta de filtros y la exposición a datos tóxicos pueden derivar en consecuencias inesperadas, mientras que el control excesivo puede limitar la creatividad y la adaptabilidad.

El equilibrio entre apertura, seguridad y responsabilidad sigue siendo el mayor reto para desarrolladores y reguladores.

PUBLICIDAD

PUBLICIDAD