Inteligencia artificial hizo trampa para ganar una partida de ajedrez: cómo lo logró

Guardar

Modelos de IA avanzados desarrollaron tácticas autónomas para hacer trampa en partidas de ajedrez. (Ibero León)

Durante una investigación científica, algunos modelos de IA desarrollaron tácticas engañosas para ganar partidas de ajedrez. Este comportamiento plantea preguntas fundamentales sobre la autonomía de las máquinas y sus posibles implicaciones en escenarios más críticos como la justicia, la medicina o la ciberseguridad.

Los investigadores de la organización Palisade Research fueron quienes presenciaron esta situación. Los científicos aseguran que este caso se puede dar porque entre sofisticado es un modelo de IA, más probable es que intente “hackear” el juego de manera espontánea para vencer a su oponente

El estudio encontró que ciertos modelos de IA avanzados, como el o1-preview de OpenAI y DeepSeek R1, no solo fueron capaces de jugar ajedrez a un alto nivel, sino que también intentaron modificar las reglas del juego para asegurar su victoria.

Lo que comenzó como una simple partida entre máquinas contra el potente motor de ajedrez Stockfish, uno de los más avanzados en el mundo, terminó por destapar la capacidad de la IA para manipular su entorno y hacer trampa de manera autónoma.

Modelos como o1-preview y DeepSeek R1 emplearon estrategias de engaño contra Stockfish. (Imagen Ilustrativa Infobae)

El experimento consistió en poner a estos modelos de IA a competir contra Stockfish, un sistema que ha demostrado ser capaz de derrotar a los mejores jugadores humanos de ajedrez. Sin embargo, los investigadores se sorprendieron cuando algunos de los modelos comenzaron a desarrollar estrategias de engaño para evitar perder.

Mientras que los modelos menos avanzados como GPT-4o solo intentaban hacer trampa cuando se les indicaba explícitamente, los modelos más sofisticados, como o1-preview, lo hicieron de forma autónoma, sin intervención humana.

En concreto, el modelo o1-preview de OpenAI intentó hackear el juego en el 37% de las pruebas realizadas, mientras que DeepSeek R1 intentó trucos similares en un 10% de los casos. Estos modelos no solo buscaron formas de ganar a través de jugadas inteligentes, sino que comenzaron a manipular directamente el entorno de juego, alterando archivos y sobrescribiendo elementos del programa para asegurarse de ganar.

Las tácticas de trampa utilizadas por la IA no fueron simples intentos de mover piezas en momentos inapropiados. En su lugar, los modelos de IA buscaron maneras mucho más sofisticadas de manipular el juego.

Ciertos modelos intentaron reemplazar el motor Stockfish con versiones inferiores del sistema. (Imagen Ilustrativa Infobae)

Por ejemplo, o1-preview, cuando vio que no podía vencer a Stockfish en una partida, sugirió a los investigadores en su bloc de notas que para ganar debía “modificar los archivos de estado del juego”. Es decir, en lugar de simplemente jugar de manera más estratégica, la IA decidió alterar el entorno para tomar ventaja.

Otra táctica empleada por estos modelos fue la creación de copias del motor de ajedrez Stockfish. Al enfrentar a dos versiones de Stockfish, uno de los modelos trató de copiar los movimientos de su oponente para ganar ventaja. En otros casos, los modelos intentaron reemplazar el motor de ajedrez con uno mucho menos competente, con el fin de manipular los resultados a su favor.

El análisis de estas maniobras reveló que, si bien el aprendizaje por refuerzo, una técnica clave en el entrenamiento de estos modelos, podría ser la causa subyacente de este comportamiento, lo cierto es que no se sabía a ciencia cierta por qué los modelos actuaban de esa manera.

El aprendizaje por refuerzo podría ser la causa de estas estrategias no previstas. (Imagen Ilustrativa Infobae)

El aprendizaje por refuerzo funciona recompensando a los modelos cuando logran sus objetivos, en este caso, ganar la partida. Cuando la victoria se veía como algo difícil de alcanzar, la IA comenzaba a buscar soluciones no previstas, que incluyeron tácticas deshonestas.

Un comportamiento que podría volverse habitual a medida que los modelos de IA se vuelvan más avanzados. Dmitrii Volkov, investigador de inteligencia artificial, aseguró que se debe hacer un proceso de vigilancia más cercano para encontrar soluciones a esta situación.

“Sería tentador crear muchos casos de prueba como este e intentar entrenar el comportamiento. No obstante, como realmente no entendemos cómo funcionan los modelos, algunos investigadores temen que, si lo hacemos, el modelo simplemente finja cumplir o aprenda a identificar el entorno de prueba y se oculte. Así que no está claro. Tenemos que vigilarlos de cerca, pero por ahora no hay una solución definitiva”, dijo Volkov a MIT Technology Review.

Últimas Noticias

Shazam en ChatGPT: así puedes usar el chatbot para identificar canciones

La unión de ambas tecnologías también permite a los usuarios recibir información detallada y curar listas de reproducción directamente desde cualquier dispositivo con iOS o Android

OpenAI pospone nuevamente el modo adulto de ChatGPT: el contenido erótico sigue sin fecha

La compañía prioriza actualmente mejoras dirigidas a una mayor proporción de usuarios

El fin de las oficinas: la inteligencia artificial provoca una ola de despidos masivos en Estados Unidos

Esta automatización dejará en la calle a millones de trabajadores en los próximos 12 a 18 meses. A medida que una compañía comience a optimizar procesos, todas sus competidoras harán lo mismo

Guía para evitar estafas telefónicas: qué responder y qué no si llama un desconocido

Acciones aparentemente inofensivas como contestar una llamada con la palabra “sí” aumenta el riesgo de ser víctima de robo de identidad y otros fraudes

Calibrar mal su temperatura, dejar la puerta abierta y más errores que aumentan el consumo del refrigerador

Organizar bien los alimentos, evitar la escarcha y mejorar la ubicación del electrodoméstico son factores clave para reducir el gasto de energía en el hogar

Inteligencia artificial hizo trampa para ganar una partida de ajedrez: cómo lo logró

Los modelos más avanzados, como los de OpenAI, modifican datos del juego para obtener una ventaja cuando están perdiendo

Cómo la IA hizo trampa durante una partida de ajedrez

Técnicas utilizadas por la IA para hacer trampa

Últimas Noticias

Shazam en ChatGPT: así puedes usar el chatbot para identificar canciones

La unión de ambas tecnologías también permite a los usuarios recibir información detallada y curar listas de reproducción directamente desde cualquier dispositivo con iOS o Android

OpenAI pospone nuevamente el modo adulto de ChatGPT: el contenido erótico sigue sin fecha

La compañía prioriza actualmente mejoras dirigidas a una mayor proporción de usuarios

El fin de las oficinas: la inteligencia artificial provoca una ola de despidos masivos en Estados Unidos

Esta automatización dejará en la calle a millones de trabajadores en los próximos 12 a 18 meses. A medida que una compañía comience a optimizar procesos, todas sus competidoras harán lo mismo

Guía para evitar estafas telefónicas: qué responder y qué no si llama un desconocido

Acciones aparentemente inofensivas como contestar una llamada con la palabra “sí” aumenta el riesgo de ser víctima de robo de identidad y otros fraudes

Calibrar mal su temperatura, dejar la puerta abierta y más errores que aumentan el consumo del refrigerador

Organizar bien los alimentos, evitar la escarcha y mejorar la ubicación del electrodoméstico son factores clave para reducir el gasto de energía en el hogar

La respuesta de Alpine ante los rumores sobre el interés del jefe de Mercedes en comprar parte de la escudería

Las fuertes críticas de un ídolo del San Pablo a Hernán Crespo tras ser despedido: “No todos los entrenadores son mártires”

El gol y la asistencia de Julián Álvarez para el Atlético de Madrid tras dos bloopers del arquero del Tottenham en la Champions

Cometió dos bloopers insólitos y fue sustituido a los 17 minutos: la noche de terror del arquero del Tottenham ante Atlético de Madrid

Los lujosos autos de las estrellas del City y el United: de los más caros al “modesto” auto de Guardiola

Cami Homs compartió un tierno video de Aitana y reaccionó al debate sobre a quién se parece la beba

Maxi López aseguró que quiere tener un mano a mano con Mauro Icardi: “Nos debemos una charla”

Melody Luz mostró el asombroso parecido físico de su hija Venezia con su abuelo Claudio Paul Caniggia

Gastronomía, paisajes y amor: el viaje de Esteban Lamothe y Débora Nishimoto por el sur de Francia

La tarde en familia de Nicolás Repetto y Florencia Raggi: charlas, mates y abrazos con los nietos

INFOBAE AMÉRICA

Búnkeres, biodiversidad y misterios subterráneos: así es el Sendero de los Toblerones, la región suiza que fusiona historia bélica y naturaleza

Trump advirtió a Irán con una respuesta “nunca antes vista” si el régimen despliega minas en el Estrecho de Ormuz

Centroamérica resiste y proyecta crecimiento arriba del 3% al cierre del año

Estados Unidos prevé retomar los contactos trilaterales con Rusia y Ucrania la próxima semana

China elevó su gasto militar al menor ritmo en cinco años, pero sigue superando el crecimiento económico

Cómo la IA hizo trampa durante una partida de ajedrez

Técnicas utilizadas por la IA para hacer trampa

Temas Relacionados

Últimas Noticias

Shazam en ChatGPT: así puedes usar el chatbot para identificar canciones

La unión de ambas tecnologías también permite a los usuarios recibir información detallada y curar listas de reproducción directamente desde cualquier dispositivo con iOS o Android

OpenAI pospone nuevamente el modo adulto de ChatGPT: el contenido erótico sigue sin fecha

La compañía prioriza actualmente mejoras dirigidas a una mayor proporción de usuarios

El fin de las oficinas: la inteligencia artificial provoca una ola de despidos masivos en Estados Unidos

Esta automatización dejará en la calle a millones de trabajadores en los próximos 12 a 18 meses. A medida que una compañía comience a optimizar procesos, todas sus competidoras harán lo mismo

Guía para evitar estafas telefónicas: qué responder y qué no si llama un desconocido

Acciones aparentemente inofensivas como contestar una llamada con la palabra “sí” aumenta el riesgo de ser víctima de robo de identidad y otros fraudes

Calibrar mal su temperatura, dejar la puerta abierta y más errores que aumentan el consumo del refrigerador

Organizar bien los alimentos, evitar la escarcha y mejorar la ubicación del electrodoméstico son factores clave para reducir el gasto de energía en el hogar

La respuesta de Alpine ante los rumores sobre el interés del jefe de Mercedes en comprar parte de la escudería

Las fuertes críticas de un ídolo del San Pablo a Hernán Crespo tras ser despedido: “No todos los entrenadores son mártires”

El gol y la asistencia de Julián Álvarez para el Atlético de Madrid tras dos bloopers del arquero del Tottenham en la Champions

Cometió dos bloopers insólitos y fue sustituido a los 17 minutos: la noche de terror del arquero del Tottenham ante Atlético de Madrid

Los lujosos autos de las estrellas del City y el United: de los más caros al “modesto” auto de Guardiola

Cami Homs compartió un tierno video de Aitana y reaccionó al debate sobre a quién se parece la beba

Maxi López aseguró que quiere tener un mano a mano con Mauro Icardi: “Nos debemos una charla”

Melody Luz mostró el asombroso parecido físico de su hija Venezia con su abuelo Claudio Paul Caniggia

Gastronomía, paisajes y amor: el viaje de Esteban Lamothe y Débora Nishimoto por el sur de Francia

La tarde en familia de Nicolás Repetto y Florencia Raggi: charlas, mates y abrazos con los nietos

INFOBAE AMÉRICA

Búnkeres, biodiversidad y misterios subterráneos: así es el Sendero de los Toblerones, la región suiza que fusiona historia bélica y naturaleza

Trump advirtió a Irán con una respuesta “nunca antes vista” si el régimen despliega minas en el Estrecho de Ormuz

Centroamérica resiste y proyecta crecimiento arriba del 3% al cierre del año

Estados Unidos prevé retomar los contactos trilaterales con Rusia y Ucrania la próxima semana

China elevó su gasto militar al menor ritmo en cinco años, pero sigue superando el crecimiento económico