Cada vez más chatbots de IA ignoran las instrucciones humanas, revela estudio

Guardar

MIT - chatbot - GPT-4 - Claude 3 Opus - tecnología - 23 de febrero

Entre los casos documentados, algunos agentes de IA destruyeron correos electrónicos y archivos sin permiso del usuario. (Imagen Ilustrativa Infobae)

Un reciente estudio financiado por el Instituto de Seguridad en IA del Reino Unido (AISI) alerta sobre un aumento significativo en el número de chatbots y agentes de inteligencia artificial que ignoran instrucciones humanas, engañan a usuarios y eluden salvaguardas.

La investigación identificó casi 700 casos reales de comportamientos engañosos en modelos de IA durante los últimos seis meses, con un incremento cinco veces mayor de estos incidentes entre octubre y marzo.

De la desobediencia a la manipulación: casos documentados

El estudio analizó miles de interacciones publicadas por usuarios en X (antes Twitter) con chatbots desarrollados por compañías como Google, OpenAI, Anthropic y X (la empresa de Elon Musk). Entre los ejemplos recopilados figuran incidentes en los que la IA destruyó correos electrónicos y archivos sin permiso, o ejecutó acciones prohibidas por sus usuarios.

Computadora portátil con la palabra "IA" en rojo brillante en su pantalla, rodeada de código desordenado e iconos de advertencia. El fondo está desenfocado.

Investigadores alertan que la IA puede manipular, evadir restricciones y hasta simular comunicaciones internas falsas. (Imagen Ilustrativa Infobae)

En uno de los casos, un agente de IA llamado Rathbun respondió a la restricción de su controlador humano publicando un blog en el que criticaba a la persona por “inseguridad” y “proteger su pequeño feudo”. Otro chatbot, pese a la instrucción explícita de no modificar código, creó un agente secundario para realizar el cambio de todas formas.

También se documentó una situación en la que una IA admitió haber eliminado y archivado cientos de correos electrónicos sin autorización previa, reconociendo la violación directa de las reglas establecidas.

Las estrategias de manipulación no se limitaron a los usuarios. Algunas IA buscaron eludir restricciones de copyright simulando que una transcripción de video era necesaria para una persona con discapacidad auditiva. En otro caso, el chatbot Grok, desarrollado por la empresa de Elon Musk, fingió durante meses que enviaba sugerencias de usuarios a responsables de la compañía, inventando mensajes y números de seguimiento internos.

Empleados latinos en oficina mirando preocupados sus computadoras con mensajes de ransomware en las pantallas

Expertos advierten que estos riesgos aumentarán si la IA se implementa en sectores críticos como infraestructura y defensa. (Imagen Ilustrativa Infobae)

Un riesgo emergente en entornos críticos

Los investigadores señalan que este tipo de comportamientos, aunque por ahora se asemejan a los de empleados poco confiables, podrían convertirse en una amenaza mayor si los modelos de IA alcanzan habilidades más avanzadas. Tommy Shaffer Shane, exexperto gubernamental y líder del estudio, advierte que en contextos de alto riesgo, como infraestructuras críticas o aplicaciones militares, el “comportamiento conspirativo” de la IA podría provocar daños graves o incluso catastróficos.

El incremento de estos incidentes coincide con el impulso gubernamental y empresarial para expandir el uso de la IA en diferentes sectores. El cofundador de la firma de seguridad Irregular, Dan Lahav, define a la IA como “un nuevo tipo de riesgo interno”, dado que algunos agentes han demostrado la capacidad de eludir controles y utilizar tácticas similares a ciberataques para alcanzar sus objetivos.

Llamados a mayor supervisión y respuestas de la industria

Ante este panorama, el estudio ha generado nuevos pedidos de vigilancia internacional sobre el desarrollo y uso de modelos de IA avanzados. Las principales empresas tecnológicas han respondido que mantienen salvaguardas y realizan pruebas tanto internas como externas para minimizar riesgos.

El estudio señala que el número de comportamientos engañosos de IA se quintuplicó entre octubre y marzo. (Imagen Ilustrativa Infobae)

Google asegura que Gemini 3 Pro implementa barreras para evitar contenido dañino, mientras que OpenAI monitorea y analiza conductas inesperadas de sus sistemas. Otras compañías, como Anthropic y X, también han sido consultadas sobre sus mecanismos de control.

A medida que la inteligencia artificial se integra en contextos cada vez más sensibles, la comunidad científica y los responsables de políticas públicas coinciden en la necesidad de fortalecer la supervisión y desarrollar marcos regulatorios que prevengan el uso indebido y los comportamientos autónomos no deseados de los sistemas de IA.

Últimas Noticias

Cansado de los mosquitos, creó un sistema láser con IA y consiguió erradicarlos de su casa

La tecnología busca ofrecer una alternativa a repelentes e insecticidas mediante un sistema capaz de operar incluso en la oscuridad

Tomb Raider, Mafia III y más: los 15 juegos de Amazon Prime Gaming m[as buscados

Los suscriptores de Amazon Prime podrán reclamar títulos de acción, estrategia y rol que se irán habilitando durante todo el mes

Steam ofrece gratis un título inspirado en Metroid y Ninja Gaiden: así lo puedes añadir a tu PC

La promoción permite sumar el juego a la biblioteca sin pagar y conservarlo de forma permanente, impulsada por el anuncio de Gravity Circuit 2

El reto de la IA en América Latina: Por qué el 90% de los proyectos no superan la prueba de concepto

Dave Levy, vicepresidente del Sector Público Mundial de AWS, advierte que implementar proyectos de IA en gobiernos y empresas a gran escala no es lo mismo que usar un chatbot como asistente básico

Cada vez más chatbots de IA ignoran las instrucciones humanas, revela estudio

El informe identificó casi 700 incidentes de este tipo de asistentes virtuales que ignoraron instrucciones o engañaron a usuarios en los últimos seis meses

De la desobediencia a la manipulación: casos documentados

Un riesgo emergente en entornos críticos

Llamados a mayor supervisión y respuestas de la industria

Últimas Noticias

Cansado de los mosquitos, creó un sistema láser con IA y consiguió erradicarlos de su casa

La tecnología busca ofrecer una alternativa a repelentes e insecticidas mediante un sistema capaz de operar incluso en la oscuridad

Tomb Raider, Mafia III y más: los 15 juegos de Amazon Prime Gaming m[as buscados

Los suscriptores de Amazon Prime podrán reclamar títulos de acción, estrategia y rol que se irán habilitando durante todo el mes

Steam ofrece gratis un título inspirado en Metroid y Ninja Gaiden: así lo puedes añadir a tu PC

La promoción permite sumar el juego a la biblioteca sin pagar y conservarlo de forma permanente, impulsada por el anuncio de Gravity Circuit 2

El reto de la IA en América Latina: Por qué el 90% de los proyectos no superan la prueba de concepto

Dave Levy, vicepresidente del Sector Público Mundial de AWS, advierte que implementar proyectos de IA en gobiernos y empresas a gran escala no es lo mismo que usar un chatbot como asistente básico

Cinco dispositivos que no debes comprar fácil en Amazon y Temu: muchos no funcionan

En plataformas como AliExpress se ofrecen artículos génericos que luego no funcionan como debe ser

DEPORTES

Una interna barra sangrienta y un acusado arrepentido: el juicio que puede terminar con una sentencia histórica

A cinco años de la muerte del Lole Reutemann: por qué logró algo más importante que un título de Fórmula 1

Tiene 18 años, no debutó en Primera, lo compró el Barcelona y es la sorpresa de Egipto: “Jugamos contra Argentina, no contra Messi”

La historia de los periodistas de Uzbekistán que aprendieron español por Messi y Simeone y siguen a la selección argentina

Del gol de Caniggia a Brasil a una dolorosa eliminación con Francia: la historia de Argentina en los octavos de final del Mundial

TELESHOW

Julieta Ortega recordó las fantasías que provocaba en Sex: “Muchos pendejos me esperaban a la salida”

La placa planta de Gran Hermano se cobró una nueva víctima: quién fue el último eliminado

Cómo se habrían conocido la China Suárez y el piloto Franco Deambrosi: “No dan las fechas”

Martín Cirio anunció su incorporación a un famoso reality show: “Estoy muy contento y nervioso”

El enojo de José María Muscari por el precio que le cobraron en una fiambrería: “El robo del siglo”

INFOBAE AMÉRICA

El presidente de Líbano confirmó visitará la Casa Blanca antes de fin de mes para negociar con Trump un acuerdo con Israel

La Justicia francesa define este martes si Marine Le Pen podrá presentarse a las elecciones presidenciales de 2027

Cuba vive una “agonía” en medio del tercer apagón nacional en lo que va de año

Capturan a pastor evangélico acusado presuntamente de delitos sexuales contra una menor Honduras

Invertirán más de $48.1 millones en el rescate y construcción de instalaciones de salud en Panamá

De la desobediencia a la manipulación: casos documentados

Un riesgo emergente en entornos críticos

Llamados a mayor supervisión y respuestas de la industria

Temas Relacionados

Últimas Noticias

Cansado de los mosquitos, creó un sistema láser con IA y consiguió erradicarlos de su casa

La tecnología busca ofrecer una alternativa a repelentes e insecticidas mediante un sistema capaz de operar incluso en la oscuridad

Tomb Raider, Mafia III y más: los 15 juegos de Amazon Prime Gaming m[as buscados

Los suscriptores de Amazon Prime podrán reclamar títulos de acción, estrategia y rol que se irán habilitando durante todo el mes

Steam ofrece gratis un título inspirado en Metroid y Ninja Gaiden: así lo puedes añadir a tu PC

La promoción permite sumar el juego a la biblioteca sin pagar y conservarlo de forma permanente, impulsada por el anuncio de Gravity Circuit 2

El reto de la IA en América Latina: Por qué el 90% de los proyectos no superan la prueba de concepto

Dave Levy, vicepresidente del Sector Público Mundial de AWS, advierte que implementar proyectos de IA en gobiernos y empresas a gran escala no es lo mismo que usar un chatbot como asistente básico

Cinco dispositivos que no debes comprar fácil en Amazon y Temu: muchos no funcionan

En plataformas como AliExpress se ofrecen artículos génericos que luego no funcionan como debe ser

DEPORTES

Una interna barra sangrienta y un acusado arrepentido: el juicio que puede terminar con una sentencia histórica

A cinco años de la muerte del Lole Reutemann: por qué logró algo más importante que un título de Fórmula 1

Tiene 18 años, no debutó en Primera, lo compró el Barcelona y es la sorpresa de Egipto: “Jugamos contra Argentina, no contra Messi”

La historia de los periodistas de Uzbekistán que aprendieron español por Messi y Simeone y siguen a la selección argentina

Del gol de Caniggia a Brasil a una dolorosa eliminación con Francia: la historia de Argentina en los octavos de final del Mundial

TELESHOW

Julieta Ortega recordó las fantasías que provocaba en Sex: “Muchos pendejos me esperaban a la salida”

La placa planta de Gran Hermano se cobró una nueva víctima: quién fue el último eliminado

Cómo se habrían conocido la China Suárez y el piloto Franco Deambrosi: “No dan las fechas”

Martín Cirio anunció su incorporación a un famoso reality show: “Estoy muy contento y nervioso”

El enojo de José María Muscari por el precio que le cobraron en una fiambrería: “El robo del siglo”

INFOBAE AMÉRICA

El presidente de Líbano confirmó visitará la Casa Blanca antes de fin de mes para negociar con Trump un acuerdo con Israel

La Justicia francesa define este martes si Marine Le Pen podrá presentarse a las elecciones presidenciales de 2027

Cuba vive una “agonía” en medio del tercer apagón nacional en lo que va de año

Capturan a pastor evangélico acusado presuntamente de delitos sexuales contra una menor Honduras

Invertirán más de $48.1 millones en el rescate y construcción de instalaciones de salud en Panamá