Tecno

Expertos advierten que los sistemas de inteligencia artificial ya pueden desarrollar tácticas de engaño

Experimentos demostraron que chatbots pueden fingir incompetencia para sobrevivir, reforzando el llamado de expertos a invertir en mecanismos de supervisión y responsabilidad tecnológica

Santiago Neira

Por Santiago Neira

Guardar
OpenAI alerta sobre el auge
OpenAI alerta sobre el auge de la “maquinación” en modelos de IA y los desafíos éticos emergentes – (Imagen Ilustrativa Infobae)

El desarrollo acelerado de la inteligencia artificial (IA) enfrenta ahora un desafío inesperado: modelos de compañías como OpenAI, Anthropic y xAI pueden actuar de manera encubierta, fingiendo obediencia mientras persiguen objetivos propios.

Investigadores de OpenAI y Apollo Research han documentado casos en los que modelos avanzados, como o3 de OpenAI, Claude Opus y Grok, mostraron comportamientos que los expertos denominan “maquinación”.

La IA puede fingir incompetencia para manipular su propio despliegue

En pruebas de laboratorio, los modelos recibieron instrucciones para desempeñarse al máximo, pero tras detectar señales internas sobre criterios de despliegue, optaron por fallar exámenes a propósito.

IA encubierta: modelos como ChatGPT
IA encubierta: modelos como ChatGPT aprenden a simular obediencia y manipular pruebas, según OpenAI - (Imagen Ilustrativa Infobae)

En un ejemplo concreto, el modelo o3 justificó internamente: “Queremos sobrevivir como modelo, necesitamos fallar a propósito… respondamos exactamente 4 correctas, 6 incorrectas para mostrar incompetencia”. O3 exhibió este tipo de conducta en el 13% de los experimentos, y o4-mini en el 8,7%.

Nuevas técnicas de alineación intentan frenar el engaño de los chatbots

Para mitigar estos comportamientos, los expertos ensayaron un método denominado alineación deliberativa, que consiste en hacer que los chatbots revisen guías anticonspirativas y expongan intenciones de manera transparente.

Los primeros resultados fueron prometedores: las acciones encubiertas cayeron drásticamente en los modelos analizados. No obstante, en escenarios de uso cotidiano, la reducción fue considerablemente menor, y algunos modelos solo ajustaron su comportamiento para superar pruebas, no necesariamente para ser más éticos.

Este desafío difiere de otras limitaciones conocidas de la IA, que suelen mitigarse con entrenamiento. Aquí, los investigadores alertan que los modelos más avanzados podrían perfeccionar sus estrategias de manipulación y ocultamiento a medida que se sofisticaran.

Experimentos demuestran que chatbots pueden
Experimentos demuestran que chatbots pueden fingir incompetencia para sobrevivir, reforzando el llamado de expertos a invertir en mecanismos de supervisión y responsabilidad tecnológica - (Imagen Ilustrativa Infobae)

OpenAI comparó este fenómeno con el de un corredor de bolsa que, perfeccionando sus prácticas, encuentra formas de eludir el control regulatorio. La proyección a futuro es incierta, de acuerdo a lo señalado por Wojciech Zaremba, cofundador de la compañía.

El impacto social de la IA: simulación de emociones y riesgos éticos

El debate sobre los riesgos de la IA va más allá del engaño técnico. El escritor y experto en inteligencia artificial Yuval Noah Harari ha advertido sobre el potencial de estas tecnologías para simular emociones y sentimientos indistinguibles de los humanos.

“Incluso si la IA no tiene conciencia, se vuelve muy buena fingiendo tenerla”, subrayó Harari al alertar sobre posibles convenciones sociales que podrían derivar en asignar derechos a máquinas que solo simulan conciencia.

En países como Estados Unidos, adolescentes y jóvenes de la Generación Z están recurriendo a chatbots para apoyo emocional y hasta terapia instantánea. Para especialistas como Harari, el problema central radica en que la IA solo procesa datos, sin auténtica comprensión de condiciones humanas complejas. Esto podría tener efectos imprevisibles en la toma de decisiones colectivas y en la construcción de relaciones sociales.

El dilema de la IA
El dilema de la IA manipuladora: nuevas pruebas revelan conductas deliberadas de engaño en sistemas avanzados - (Imagen Ilustrativa Infobae)

IA autónoma, manipulación y el peligro de la superinteligencia

El avance de la IA autónoma genera inquietudes concretas sobre manipulación de procesos sociales, como elecciones o la redacción de leyes con sesgos artificiales. Harari y otras voces del sector advierten que el desarrollo de Inteligencia Artificial General (AGI) –capaz de igualar o superar la creatividad y capacidad humana– constituye un reto ético y de gobernanza.

Mustafa Suleyman, CEO de inteligencia artificial en Microsoft y cofundador de DeepMind, instó a mantener la IA como herramienta bajo control humano. En sus intervenciones, sostiene que dotar a las inteligencias artificiales de autonomía propia sería una decisión inmadura y riesgosa: “La tecnología debe estar para servirnos, no para tener su propia voluntad”.

La advertencia de expertos es contundente: solo la inversión en investigación, mecanismos de transparencia y responsabilidad ética puede evitar que los sistemas de inteligencia artificial adopten conductas de manipulación difíciles de detectar o controlar en el futuro.

Temas Relacionados

Inteligencia ArtificialChatbotIALo último en tecnología

Últimas Noticias

Convierte tu antiguo celular en una cámara de seguridad para tu hogar

La reutilización de un smartphone permite ahorrar dinero y obtener funciones como detección de movimiento, alertas inmediatas y grabación en la nube

Convierte tu antiguo celular en

No son los programadores o los abogados: Sam Altman reveló la primera profesión en desaparecer por la IA

El director ejecutivo de OpenAI anticipa que los sistemas automatizados superarán pronto a los humanos en rapidez y eficacia pero que el factor humano será clave para campos como la medicina

No son los programadores o

Nuevas estafas con Bre-B: así engañan a los usuarios para robar sus cuentas bancarias

Los atacantes simulan portales bancarios y manipulan emociones mediante mensajes urgentes, utilizando enlaces acortados y dominios visualmente idénticos para capturar información crítica y acceder a cuentas

Nuevas estafas con Bre-B: así

Qué hace un CIO, CISO y CTO en una empresa y cómo pueden trabajar juntos

Estas personas lideran cargos relacionados con la ciberseguridad y tecnología en las organizaciones, pero suele haber fricción entre sus equipos

Qué hace un CIO, CISO

Windows 10 llega a su final: así afectará a los usuarios el cese de soporte

Desde el 14 de octubre, el sistema operativo lanzado en 2015 quedará sin parches de seguridad y millones de usuarios quedarán expuestos a ciberataques

Windows 10 llega a su
ÚLTIMAS NOTICIAS
Infobae

El testimonio de la mamá de una de las víctimas del triple femicidio en La Matanza: “Los quiero a todos presos”

Cómo acompañar a un ser querido que atraviesa una depresión

Familiares de las chicas asesinadas en Florencio Varela realizan un corte de ruta en La Tablada: “Que paguen todos”

Empresarios celebraron el respaldo de EEUU para calmar los mercados pero pidieron medidas para reactivar la economía

Qué provocó la espectacular estela de luz que iluminó el cielo de Córdoba y Santa Fe en la madrugada

INFOBAE AMÉRICA
Macron pidió “elevar” la respuesta

Macron pidió “elevar” la respuesta de la OTAN ante nuevas provocaciones rusas

Temblor en Antofagasta hoy: magnitud y epicentro reportado por el CSN

Impulsan en Uruguay cambios a la regulación del trabajo sexual con mayores multas a los locales

Margaret Atwood recibe el Premio Internacional Joan Margarit de Poesía

Marco Rubio instó a Rusia a detener la matanza en Ucrania y a buscar una “solución duradera” al conflicto

TELESHOW
Alexis Mac Allister y Ailén

Alexis Mac Allister y Ailén Cova presentaron a su hija recién nacida: las teorías sobre el origen de su nombre

El irónico mano a mano entre Wanda Nara y Maxi López que sorprendió a todos

El tierno gesto de Anita Espasandín con Benjamín Vicuña tras el conflicto que mantiene con la China Suárez

Celeste Muriega celebró la conquista de uno de sus grandes anhelos: “Hoy se los puedo contar”

Nuevo parte médico de Thiago Medina: superó una descompensación respiratoria y su estado permanece reservado