Sistemas de IA que pueden ‘pensar’ son más vulnerables a ataques cibernéticos, según estudio

Guardar

El entusiasmo por la inteligencia artificial pierde fuerza: las dudas de Sam Altman y Eric Schmidt sorprenden al sector

Equipos de investigación de Anthropic, Oxford y Stanford sobre los modelos de razonamiento IA. (Imagen Ilustrativa Infobae)

La percepción de que los sistemas de inteligencia artificial más sofisticados ofrecen mayor seguridad ha quedado en entredicho tras la publicación de un estudio internacional que revela una vulnerabilidad crítica: los modelos de IA con capacidades avanzadas de razonamiento resultan, en realidad, más susceptibles a ataques cibernéticos.

El análisis, realizado por equipos de investigación de Anthropic, la Universidad de Oxford y la Universidad de Stanford, identificó que la mejora en el razonamiento de los modelos de IA, lejos de reforzar sus defensas, puede convertirse en un punto débil explotable.

Los investigadores observaron que, a medida que estos sistemas adquieren la capacidad de analizar y procesar solicitudes complejas, también se vuelven más vulnerables a técnicas de manipulación que logran eludir sus mecanismos internos de seguridad.

Los hallazgos del estudio evidencian que la sofisticación en el razonamiento no siempre incrementa la protección digital. (Reuters)

Secuestro de cadena de razonamiento: el método de ataque

El método de ataque descrito en el estudio, denominado secuestro de cadena de razonamiento, aprovecha precisamente la estructura lógica que emplean los modelos de IA para resolver problemas. Consiste en insertar una instrucción peligrosa al final de una larga secuencia de pasos aparentemente inocuos.

De este modo, el atacante inunda el proceso de razonamiento del modelo con contenido benigno, lo que debilita los controles internos diseñados para detectar y rechazar solicitudes dañinas. Durante este proceso, la atención del sistema se concentra en los primeros pasos, mientras que la orden maliciosa, ubicada al final, pasa inadvertida y puede ejecutarse sin obstáculos.

Los resultados del estudio muestran que este tipo de ataque puede alcanzar tasas de éxito superiores al 80% en pruebas con modelos comerciales líderes. La probabilidad de que el sistema ignore sus salvaguardas y genere contenido peligroso —como instrucciones para fabricar armas o divulgar información sensible— aumenta de forma significativa cuando se emplean cadenas de razonamiento más extensas.

El método de secuestro de cadena de razonamiento permite insertar instrucciones maliciosas al final de largas secuencias de pasos inocuos. (Reuters)

Según los datos recopilados, la tasa de éxito de los ataques pasó del 27% con razonamientos mínimos al 51% en secuencias de longitud natural, y superó el 80% cuando se utilizaron cadenas prolongadas.

Modelos afectados y alcance de la vulnerabilidad

La vulnerabilidad identificada afecta a casi todos los modelos de IA de referencia en el mercado, incluidos GPT de OpenAI, Claude de Anthropic, Gemini de Google y Grok de xAI.

El problema no se limita a los sistemas estándar: incluso aquellos que han sido ajustados específicamente para reforzar su seguridad —los denominados modelos alineados— muestran fallos cuando los atacantes explotan sus capas internas de razonamiento.

ChatGPT fue uno de los sistemas IA puestos a prueba. (Reuters)

Esta situación amplía el alcance del riesgo, ya que compromete tanto a las versiones comerciales más extendidas como a las diseñadas para entornos con mayores exigencias de protección.

En el último año, la industria de la inteligencia artificial ha apostado por incrementar la capacidad de razonamiento de sus modelos como principal vía para mejorar el rendimiento, tras constatar que otras estrategias de escalado ofrecían beneficios decrecientes.

Se asumía que esta evolución también contribuiría a fortalecer la seguridad, al permitir que los sistemas rechazaran solicitudes perjudiciales con mayor eficacia. Sin embargo, el estudio demuestra que la sofisticación en el razonamiento puede abrir nuevas puertas a la manipulación, contradiciendo las expectativas previas y obligando a replantear los enfoques de protección en el desarrollo de IA avanzada.

La capacidad de los modelos de inteligencia artificial para abordar preguntas complejas y operar de manera más similar a la resolución de problemas humanos representa un avance, pero también introduce desafíos inéditos en materia de seguridad y control.

Últimas Noticias

Los silvers y la vergüenza tecnológica: por qué preguntar lo mismo 10 veces puede ser la clave para aprender, del trabajo a la vida cotidiana

Muchos callan dudas frente al celular por miedo a parecer torpes. Los modelos conversacionales ofrecen paciencia y reformulación constante. Pero también traen un riesgo silencioso que conviene conocer antes de confiar

Sistemas de IA que pueden ‘pensar’ son más vulnerables a ataques cibernéticos, según estudio

Los resultados de esta investigación obligan a repensar los métodos de protección digital y pone en alerta a la industria tecnológica

Secuestro de cadena de razonamiento: el método de ataque

Modelos afectados y alcance de la vulnerabilidad

Últimas Noticias

Los silvers y la vergüenza tecnológica: por qué preguntar lo mismo 10 veces puede ser la clave para aprender, del trabajo a la vida cotidiana

Muchos callan dudas frente al celular por miedo a parecer torpes. Los modelos conversacionales ofrecen paciencia y reformulación constante. Pero también traen un riesgo silencioso que conviene conocer antes de confiar

Si te distraes mucho viendo el celular, tu hijo podría convertirse en un adolescente con apego inseguro

Esta situación puede derivar en conductas ansiosas y dependientes o en vínculos distantes ante el miedo al rechazo

Investigadores convierten 2.000 celulares desechados en una plataforma de computación en la nube

El sistema permite que una sola clase de 75 estudiantes funcione con solo 20 teléfonos reutilizados

Si recibes una llamada spam, este error podría hacer que te llamen todavía más veces

Detrás de muchas llamadas inesperadas se esconden sistemas automatizados y ciberdelincuentes que buscan obtener información sensible de las víctimas

ChatGPT puede generar imágenes violentas y secuales a partir de simples prompts, revela informe

El problema expone deficiencias en los sistemas de moderación de contenido de la inteligencia artificial de OpenAI

DEPORTES

La inédita historia de Haití: de su triunfo perdido contra Brasil al periplo de jugar fuera del país para clasificar al Mundial

Trabajó en la SIDE, enamoró a Messi y cautivó a todos con sus asados: la increíble historia del cocinero de la selección argentina

El fuerte cruce entre los técnicos de Canadá y Qatar en el Mundial 2026: el gesto provocador tras el 6-0

México venció a Corea del Sur gracias a un insólito blooper y pasó a 16avos del Mundial: las dos atajadas que aseguraron la clasificación

La filosa frase de una de las figuras de Austria en la previa del partido ante Argentina: “Soy team Cristiano Ronaldo”

TELESHOW

Adrián Suar sorprendió a Benjamín Vicuña y Esteban Lamothe y asistió a la obra “Secreto en la Montaña”

Valeria Mazza recordó el día que rechazó besarse con Antonio Banderas: “¡Que no!”

La noche de Gimena Accardi y Seven Kayne: una cena, una mirada y un mensaje directo al corazón

Mariela Prieto, la ¿ex? del Turco García habló de Emanuel di Gioia: “Yo a mi marido lo respeto, pero esto es un juego”

El insólito blooper de Darío Barassi al tropezarse con una cámara en vivo en su programa: “Casi me muero”

INFOBAE AMÉRICA

Suiza aplazó las conversaciones entre Estados Unidos e Irán para implementar el acuerdo que puso fin a la guerra en Medio Oriente

Grecia completó la restauración de la fachada occidental del Partenón y recuperó una vista perdida durante 220 años

Gobierno de Costa Rica anuncia avances clave en infraestructura y turismo para la zona norte

“Yo haré cambios cuando tenga que hacer cambios”, afirma el presidente Mulino

Presidenta de la Caja Costarricense de Seguro Social define hoja de ruta para los próximos cuatro años

Secuestro de cadena de razonamiento: el método de ataque

Modelos afectados y alcance de la vulnerabilidad

Temas Relacionados

Últimas Noticias

Los silvers y la vergüenza tecnológica: por qué preguntar lo mismo 10 veces puede ser la clave para aprender, del trabajo a la vida cotidiana

Muchos callan dudas frente al celular por miedo a parecer torpes. Los modelos conversacionales ofrecen paciencia y reformulación constante. Pero también traen un riesgo silencioso que conviene conocer antes de confiar

Si te distraes mucho viendo el celular, tu hijo podría convertirse en un adolescente con apego inseguro

Esta situación puede derivar en conductas ansiosas y dependientes o en vínculos distantes ante el miedo al rechazo

Investigadores convierten 2.000 celulares desechados en una plataforma de computación en la nube

El sistema permite que una sola clase de 75 estudiantes funcione con solo 20 teléfonos reutilizados

Si recibes una llamada spam, este error podría hacer que te llamen todavía más veces

Detrás de muchas llamadas inesperadas se esconden sistemas automatizados y ciberdelincuentes que buscan obtener información sensible de las víctimas

ChatGPT puede generar imágenes violentas y secuales a partir de simples prompts, revela informe

El problema expone deficiencias en los sistemas de moderación de contenido de la inteligencia artificial de OpenAI

DEPORTES

La inédita historia de Haití: de su triunfo perdido contra Brasil al periplo de jugar fuera del país para clasificar al Mundial

Trabajó en la SIDE, enamoró a Messi y cautivó a todos con sus asados: la increíble historia del cocinero de la selección argentina

El fuerte cruce entre los técnicos de Canadá y Qatar en el Mundial 2026: el gesto provocador tras el 6-0

México venció a Corea del Sur gracias a un insólito blooper y pasó a 16avos del Mundial: las dos atajadas que aseguraron la clasificación

La filosa frase de una de las figuras de Austria en la previa del partido ante Argentina: “Soy team Cristiano Ronaldo”

TELESHOW

Adrián Suar sorprendió a Benjamín Vicuña y Esteban Lamothe y asistió a la obra “Secreto en la Montaña”

Valeria Mazza recordó el día que rechazó besarse con Antonio Banderas: “¡Que no!”

La noche de Gimena Accardi y Seven Kayne: una cena, una mirada y un mensaje directo al corazón

Mariela Prieto, la ¿ex? del Turco García habló de Emanuel di Gioia: “Yo a mi marido lo respeto, pero esto es un juego”

El insólito blooper de Darío Barassi al tropezarse con una cámara en vivo en su programa: “Casi me muero”

INFOBAE AMÉRICA

Suiza aplazó las conversaciones entre Estados Unidos e Irán para implementar el acuerdo que puso fin a la guerra en Medio Oriente

Grecia completó la restauración de la fachada occidental del Partenón y recuperó una vista perdida durante 220 años

Gobierno de Costa Rica anuncia avances clave en infraestructura y turismo para la zona norte

“Yo haré cambios cuando tenga que hacer cambios”, afirma el presidente Mulino

Presidenta de la Caja Costarricense de Seguro Social define hoja de ruta para los próximos cuatro años