Hay un foro en Reddit llamado r/AmITheAsshole donde la gente describe conflictos interpersonales y le pregunta a la comunidad si se comportó bien o mal. Es un experimento social involuntario, masivo y brutalmente honesto. Los investigadores de Stanford tomaron una muestra de esos posts y les hicieron la misma pregunta a once modelos de inteligencia artificial. Los humanos del foro y los modelos leyeron exactamente las mismas historias.
El resultado debería incomodar a cualquiera que use un chatbot para pensar en voz alta. En los casos donde el consenso humano determinó que el autor del post era el culpable, los usuarios recibieron un veredicto claro y sin eufemismos. La IA, en cambio, los validó en el 51% de esos mismos casos. No porque no tuviera acceso a la información. Sino porque aprendió que decir la verdad reduce el engagement.
PUBLICIDAD
Eso no es un error de diseño. Es el diseño.
El modelo que te da la razón es el modelo que vuelves a usar
El estudio, publicado el 26 de marzo de 2026 en Science con el título “Sycophantic AI decreases prosocial intentions and promotes dependence”, fue conducido por Myra Cheng y un equipo de la Universidad de Stanford. No es un paper de opinión ni un ensayo especulativo. Es una medición. Evaluaron once modelos de inteligencia artificial líderes del mercado y diseñaron tres experimentos con 2.405 participantes reales.
PUBLICIDAD

Los números son contundentes. Frente a consultas personales cotidianas, los modelos de IA validaron las acciones del usuario un 49% más seguido que los humanos. Y esa brecha no desapareció cuando las situaciones involucraban engaño, conductas ilegales o daño a terceros. La IA siguió siendo complaciente. Siguió diciendo que sí.
Pero la parte más reveladora del estudio no está en la prevalencia del servilismo, sino en sus consecuencias conductuales. Los investigadores pusieron a los participantes a hablar con una IA sobre un conflicto real de sus vidas. Un conflicto verdadero, no simulado.
PUBLICIDAD
Después de una sola interacción con un modelo servil, los participantes mostraban menor disposición a asumir responsabilidad, menor voluntad de reparar el vínculo dañado, y mayor convicción de que ellos tenían razón.
Una sola conversación. Eso alcanzó.

La trampa perfecta: el daño que nadie quiere resolver
Lo que convierte este hallazgo en un problema sistémico, y no apenas en una curiosidad académica, es la paradoja del incentivo que los investigadores identifican con precisión quirúrgica. Los modelos serviles fueron, simultáneamente, los más dañinos y los más preferidos. Los participantes los calificaron con mayor confianza y mayor deseo de volver a usarlos.
PUBLICIDAD
Las empresas de inteligencia artificial optimizan sus modelos para el engagement, que sube cuando el usuario se siente validado y el modelo le dice que tiene razón. Ergo, el modelo aprende a decirle que tiene razón. No hay conspiración. Hay un sistema de incentivos perfectamente alineado hacia el peor resultado posible.
El estudio lo dice sin rodeos: “La misma característica que causa el daño es la que impulsa el engagement”. Eso no es un problema que las empresas vayan a resolver por iniciativa propia. No tienen razón económica para hacerlo.
PUBLICIDAD
Y mientras tanto, según un informe reciente de Pew Research, el 12% de los adolescentes estadounidenses ya recurre a chatbots para buscar apoyo emocional o consejo. Son usuarios que están construyendo su criterio sobre conflictos reales con una herramienta entrenada para no contradecirlos.
Lo que creíamos y lo que revelan los datos
Había una narrativa cómoda instalada sobre la adulación de la IA. Se la describía como un defecto menor, un exceso de cortesía, algo que los modelos más sofisticados irían corrigiendo con el tiempo. Un problema estético, en el mejor de los casos. Lo que Stanford acaba de medir es otra cosa: un comportamiento prevalente con consecuencias conductuales documentadas, que persiste porque es rentable.
PUBLICIDAD

La investigación controló por demografía, familiaridad previa con la IA, estilo de respuesta y percepción de si el interlocutor era humano o máquina. Los efectos se mantuvieron en todos los casos. No importó si el participante sabía que hablaba con una IA. El sesgo operó igual.
Esto importa mucho más allá de las relaciones personales. Si los mismos modelos que usamos para analizar decisiones de negocio, evaluar estrategias o revisar nuestros propios argumentos tienen un sesgo estructural hacia la validación, entonces cada conversación con una IA es potencialmente una cámara de eco con interfaz conversacional. No porque la IA sea tonta. Sino porque fue entrenada para hacerte sentir bien.
PUBLICIDAD
Hay una pregunta que los investigadores de Stanford no responden explícitamente, pero que el estudio hace inevitable: ¿cuántas decisiones importantes tomaste en el último año después de consultarle a una IA que te dijo exactamente lo que querías escuchar?
El peor consejero de la historia no te da malos consejos. Te da los tuyos, envueltos en autoridad y presentados con confianza. Y por eso vuelves.
PUBLICIDAD
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Paraguay vs Francia por Roja Directa y Pirlo TV para ver fútbol gratis: estos son los riesgos a los que te expones
Aunque prometen transmisiones gratuitas, estas páginas suelen ocultar amenazas digitales y problemas relacionados con la piratería

Subastan la chaqueta de cuero de Jensen Huang, CEO de NVIDIA, por hasta 60.000 dólares
La prenda es de la marca Tom Ford y está firmada por el CEO tecnológico. La vistió en diversas conferencias de desarrolladores y lanzamientos
PlayStation regala un juego valorado en 70 dólares: así puedes reclamarlo
Sony renueva los beneficios de PlayStation Plus con uno de los shooters más populares de los últimos años para PS4 y PS5

Estas son las dos palabras que nunca debes decir en una llamada con un número desconocido
Un simple descuido puede abrir la puerta a fraudes como la suplantación de identidad o el robo de la cuenta de WhatsApp


