Científicos de Google, OpenAI y Meta temen perder la comprensión del razonamiento de la IA

Guardar

Expertos de empresas como Google DeepMind, OpenAI, Amazon, Anthropic y Meta advierten que podríamos dejar de entender cómo razona la IA. (Imagen Ilustrativa Infobae)

Científicos de empresas líderes en inteligencia artificial como Google DeepMind, OpenAI, Amazon, Anthropic y Meta han advertido que pronto podríamos perder la capacidad de comprender cómo razona la IA.

En un documento publicado en arXiv, más de 40 expertos proponen intensificar la investigación sobre métodos para supervisar modelos avanzados, especialmente aquellos que utilizan lenguaje humano para razonar.

El grupo sugiere monitorear de forma activa las llamadas “cadenas de pensamiento” (CdP) de estos sistemas, es decir, los pasos que siguen al procesar información y tomar decisiones. Esta estrategia permitiría detectar señales de comportamientos dañinos antes de que ocurran.

El grupo propone vigilar activamente las llamadas “cadenas de pensamiento” (CdP), es decir, los procesos que los modelos siguen al analizar información y tomar decisiones. REUTERS/Toby Melville

Según explican, “los modelos de IA que piensan en lenguaje natural ofrecen una oportunidad única para mejorar la seguridad: podemos observar sus procesos internos para identificar intenciones incorrectas”.

Aunque reconocen que esta técnica no es infalible y algunos comportamientos inapropiados podrían pasar desapercibidos, consideran que es una vía prometedora.

Por ello, recomiendan seguir investigando y desarrollando esta forma de monitoreo, en conjunto con otros enfoques de seguridad existentes. El objetivo es prevenir riesgos antes de que los sistemas se vuelvan demasiado complejos o autónomos para ser comprendidos y controlados.

Aunque admiten que esta técnica no es perfecta y ciertos comportamientos podrían no detectarse, la consideran una opción con gran potencial. REUTERS/Dado Ruvic/Illustration/File Photo

Los científicos recomiendan:

“Esto ofrece una oportunidad única para la seguridad de la IA: la monitorización de la cadena de pensamiento. Un monitor de cadena de pensamiento (CdP) es un sistema automatizado que lee la CdP de un modelo de razonamiento y otra información relevante, y señala interacciones sospechosas o potencialmente dañinas. Estas respuestas podrían entonces bloquearse, reemplazarse por acciones más seguras o revisarse con mayor profundidad”.

Los científicos destacan dos razones principales por las cuales es importante monitorear las cadenas de pensamiento (CoT) en los modelos de inteligencia artificial:

En algunas tareas, los modelos necesitan expresar su razonamiento en lenguaje natural, ya que no pueden resolverlas sin esa externalización. (Imagen Ilustrativa Infobae)

Necesidad de razonar en voz alta: En ciertas tareas, los modelos deben externalizar su razonamiento en lenguaje natural porque no pueden completarlas sin hacerlo. Si las conductas más peligrosas requieren procesos de pensamiento complejos expresados en lenguaje, esto permitiría detectar comportamientos inapropiados con mayor fiabilidad.
Tendencia natural a razonar en voz alta: Incluso cuando no es estrictamente necesario, muchos modelos tienden a “pensar en voz alta”. Aunque esta tendencia no es completamente confiable, el monitoreo de estas cadenas de pensamiento puede ayudar a identificar conductas indebidas que podrían pasar desapercibidas con otros métodos.

ChatGPT y Grok a veces muestran cómo piensan sus respuestas. REUTERS/Dado Ruvic/Illustration/File Photo

Las cadenas de pensamiento (en inglés chains of thought o CdP) son una técnica en inteligencia artificial que permite a los modelos de lenguaje, como ChatGPT, “pensar en voz alta” antes de llegar a una respuesta final. Es decir, en lugar de dar una respuesta directa, el modelo genera una secuencia de pasos intermedios que reflejan su proceso de razonamiento.

¿Cómo funcionan?

Cuando se utiliza una cadena de pensamiento, el modelo:

Descompone un problema complejo en pasos más pequeños.
Explica su lógica paso a paso.
Llega a una conclusión basada en ese razonamiento.

Por ejemplo, ante la pregunta: “Si María tiene 3 manzanas y compra 2 más, ¿cuántas tiene en total?”, una IA con cadena de pensamiento podría responder:

“María comienza con 3 manzanas. Luego compra 2 más.3 + 2 = 5. Por lo tanto, tiene 5 manzanas en total”.

Las cadenas de pensamiento permiten identificar errores o sesgos en el razonamiento del modelo con mayor facilidad. (Imagen Ilustrativa Infobae)

¿Por qué son importantes?

Facilitan la detección de errores o sesgos en el razonamiento del modelo.
Permiten anticipar intenciones problemáticas, como decisiones maliciosas o manipuladoras, en modelos más avanzados.
Mejoran la seguridad de la IA, porque los desarrolladores pueden revisar el pensamiento detrás de las acciones del modelo.

Algunos de los científicos detrás de esta advertencia son:

Joe Benton – Anthropic
Joseph Bloom – UK AI Security Institute
Mark Chen – OpenAI
Alan Cooney – UK AI Security Institute
Allan Dafoe – Google DeepMind
Anca Dragan – Google DeepMind
Scott Emmons – Google DeepMind
Owain Evans – Truthful AI & UC Berkeley
David Farhi – OpenAI

Últimas Noticias

¿Difundieron tus fotos sin permiso? El nuevo cambio de Google para borrar imágenes íntimas en segundos

Disponible ya en países de Latinoamérica, esta función responde a la demanda de mayor protección frente a una de las formas más dañinas de exposición digital

¿Sospechas que alguien espía tu teléfono?: así puedes detectarlo y proteger tus datos personales

Interferencias en llamadas, batería que se agota rápido y actividad extraña en cuentas son alertas que no debes ignorar

Resident Evil Requiem es el juego más vendido en menos tiempo en la historia de la franquicia

La apuesta por el realismo actoral y el homenaje a escenarios clásicos impulsan el éxito global del juego, que ya prepara contenido adicional para seguir sorprendiendo a los fans

Agentes de IA que hacen el trabajo por ti: así puedes automatizar tareas clave en tu empresa

La integración de modelos como Model Context Protocol permiten a los agentes interactuar con sistemas internos y ejecutar acciones complejas en tiempo real

Científicos de Google, OpenAI y Meta temen perder la comprensión del razonamiento de la IA

Varios expertos de empresas tecnológicas advierten sobre la importancia de monitorear el razonamiento de las herramientas de inteligencia artificial antes de que emitan una respuesta

Por qué monitorizar las cadenas de pensamiento de la IA

Qué son las cadenas de pensamiento de la IA

Quiénes son los científicos detrás de esta advertencia

Últimas Noticias

¿Difundieron tus fotos sin permiso? El nuevo cambio de Google para borrar imágenes íntimas en segundos

Disponible ya en países de Latinoamérica, esta función responde a la demanda de mayor protección frente a una de las formas más dañinas de exposición digital

¿Sospechas que alguien espía tu teléfono?: así puedes detectarlo y proteger tus datos personales

Interferencias en llamadas, batería que se agota rápido y actividad extraña en cuentas son alertas que no debes ignorar

Resident Evil Requiem es el juego más vendido en menos tiempo en la historia de la franquicia

La apuesta por el realismo actoral y el homenaje a escenarios clásicos impulsan el éxito global del juego, que ya prepara contenido adicional para seguir sorprendiendo a los fans

Agentes de IA que hacen el trabajo por ti: así puedes automatizar tareas clave en tu empresa

La integración de modelos como Model Context Protocol permiten a los agentes interactuar con sistemas internos y ejecutar acciones complejas en tiempo real

Starlink: lista completa de iPhone y celulares Android que pueden acceder a internet satelital

Teléfonos móviles recientes de iPhone, Google Pixel, Motorola y Samsung son compatibles con esta tecnología

“¿Está para el Puskas?“: la peculiar secuencia de uno de los goles de Racing ante Lanús por el Torneo Apertura del fútbol femenino

De una golfista alemana a una ex estrella de la NFL: furor en las redes por los dos nuevos hinchas de Boca Juniors

Así quedaron los tenistas argentinos tras la última actualización del ranking ATP: Mariano Navone fue el mayor ascenso en el Top 100

Un medio inglés armó un polémico ranking de pilotos en el GP de China de F1: el llamativo lugar de Colapinto

Una perla de Racing y las selecciones juveniles de Argentina se va al Inter Miami de Lionel Messi

Andrea del Boca recordó su relación íntima con Luis Miguel y las versiones de romance: “Los mejores recuerdos”

Quién es el jugador de Los Pumas que habría conquistado a Karina La Princesita: “Muy acaramelados”

Migue Granados habló de su transformación física tras perder 20 kilos: “Déficit calórico”

Axel Kuschevatzky y su balance de los Oscar: “Mi favorita era El Agente Secreto y se fue sin nada”

Evangelina Anderson salió a caminar en pijama y de la mano de un hombre: “¿De quién se trata?”

INFOBAE AMÉRICA

Un ataque diurno inédito sobre Kiev reveló el salto tecnológico de los drones rusos

Donald Trump aseguró que la ofensiva contra el régimen iraní evitó un conflicto nuclear y la Tercera Guerra Mundial

Trump le pidió a China postergar la reunión con el presidente Xi Jinping por la guerra con Irán

Bolsonaro salió de cuidados intensivos tras presentar una mejora de su cuadro de neumonía bacteriana

Lula da Silva y Rodrigo Paz acordaron tender una línea eléctrica entre Bolivia y Brasil

Por qué monitorizar las cadenas de pensamiento de la IA

Qué son las cadenas de pensamiento de la IA

Quiénes son los científicos detrás de esta advertencia

Temas Relacionados

Últimas Noticias

¿Difundieron tus fotos sin permiso? El nuevo cambio de Google para borrar imágenes íntimas en segundos

Disponible ya en países de Latinoamérica, esta función responde a la demanda de mayor protección frente a una de las formas más dañinas de exposición digital

¿Sospechas que alguien espía tu teléfono?: así puedes detectarlo y proteger tus datos personales

Interferencias en llamadas, batería que se agota rápido y actividad extraña en cuentas son alertas que no debes ignorar

Resident Evil Requiem es el juego más vendido en menos tiempo en la historia de la franquicia

La apuesta por el realismo actoral y el homenaje a escenarios clásicos impulsan el éxito global del juego, que ya prepara contenido adicional para seguir sorprendiendo a los fans

Agentes de IA que hacen el trabajo por ti: así puedes automatizar tareas clave en tu empresa

La integración de modelos como Model Context Protocol permiten a los agentes interactuar con sistemas internos y ejecutar acciones complejas en tiempo real

Starlink: lista completa de iPhone y celulares Android que pueden acceder a internet satelital

Teléfonos móviles recientes de iPhone, Google Pixel, Motorola y Samsung son compatibles con esta tecnología

“¿Está para el Puskas?“: la peculiar secuencia de uno de los goles de Racing ante Lanús por el Torneo Apertura del fútbol femenino

De una golfista alemana a una ex estrella de la NFL: furor en las redes por los dos nuevos hinchas de Boca Juniors

Así quedaron los tenistas argentinos tras la última actualización del ranking ATP: Mariano Navone fue el mayor ascenso en el Top 100

Un medio inglés armó un polémico ranking de pilotos en el GP de China de F1: el llamativo lugar de Colapinto

Una perla de Racing y las selecciones juveniles de Argentina se va al Inter Miami de Lionel Messi

Andrea del Boca recordó su relación íntima con Luis Miguel y las versiones de romance: “Los mejores recuerdos”

Quién es el jugador de Los Pumas que habría conquistado a Karina La Princesita: “Muy acaramelados”

Migue Granados habló de su transformación física tras perder 20 kilos: “Déficit calórico”

Axel Kuschevatzky y su balance de los Oscar: “Mi favorita era El Agente Secreto y se fue sin nada”

Evangelina Anderson salió a caminar en pijama y de la mano de un hombre: “¿De quién se trata?”

INFOBAE AMÉRICA

Un ataque diurno inédito sobre Kiev reveló el salto tecnológico de los drones rusos

Donald Trump aseguró que la ofensiva contra el régimen iraní evitó un conflicto nuclear y la Tercera Guerra Mundial

Trump le pidió a China postergar la reunión con el presidente Xi Jinping por la guerra con Irán

Bolsonaro salió de cuidados intensivos tras presentar una mejora de su cuadro de neumonía bacteriana

Lula da Silva y Rodrigo Paz acordaron tender una línea eléctrica entre Bolivia y Brasil