¿Puede la IA controlarse a sí misma? Los expertos dicen que los chatbots pueden detectar los errores de los demás

Guardar

Investigadores de Oxford usan chatbots para detectar errores en respuestas de otros chatbots. (Imagen Ilustrativa Infobae)

Los chatbots de IA se sienten cada vez más cómodos en el arte de la conversación humana. El problema, dicen los expertos, es que son propensos a dar respuestas inexactas o sin sentido, lo que se conoce como “alucinaciones”. Ahora, los investigadores han encontrado una posible solución: usar chatbots para detectar errores que otros chatbots han cometido.

Sebastian Farquhar, científico informático de la Universidad de Oxford, es coautor de un estudio publicado el miércoles en la revista Nature que postula que los chatbots como ChatGPT o Gemini de Google pueden usarse para eliminar falsedades de la IA.

Los chatbots utilizan grandes modelos de lenguaje, o LLM, que consumen grandes cantidades de texto de Internet y pueden usarse para diversas tareas, incluida la generación de texto prediciendo la siguiente palabra en una oración. Los robots encuentran patrones mediante prueba y error, y luego se utiliza la retroalimentación humana para ajustar el modelo. Pero hay un inconveniente: los chatbots no pueden pensar como humanos y no entienden lo que dicen.

Chatbots pueden identificar inconsistencias en respuestas generadas por otros sistemas de IA. (EFE/ Wu Hao)

Para probar esto, Farquhar y sus colegas hicieron preguntas a un chatbot y luego utilizaron un segundo chatbot para revisar las respuestas en busca de inconsistencias, de manera similar a la forma en que la policía podría intentar hacer tropezar a un sospechoso haciéndole la misma pregunta una y otra vez. Si las respuestas tenían significados muy diferentes, eso significaba que probablemente estaban confusas.

Dijo que al chatbot se le hizo una serie de preguntas de trivia comunes, así como problemas planteados de matemáticas de la escuela primaria.

Los investigadores verificaron la precisión de la evaluación del chatbot comparándola con la evaluación humana en el mismo subconjunto de preguntas. Descubrieron que el chatbot coincidía con los evaluadores humanos el 93% de las veces, mientras que los evaluadores humanos coincidían entre sí el 92% de las veces, lo suficientemente cerca como para que los chatbots que se evaluaban entre sí “no fueran preocupantes”, dijo Farquhar.

Farquhar dijo que para el lector medio, identificar algunos errores de la IA es “bastante difícil”. A menudo tiene dificultades para detectar tales anomalías cuando utiliza LLM para su trabajo porque los chatbots “a menudo te dicen lo que quieres escuchar, inventan cosas que no solo son plausibles, sino que serían útiles si fueran ciertas, algo que los investigadores han etiquetado como ‘adulación’”, dijo en un correo electrónico.

Uso de un segundo chatbot mejora la fiabilidad de las respuestas según el estudio.(Imagen ilustrativa Infobae)

Las respuestas poco confiables son una barrera para la adopción generalizada de chatbots de IA, especialmente en campos médicos como la radiología, donde “podrían representar un riesgo para la vida humana”, dijeron los investigadores. También podrían dar lugar a precedentes legales inventados o noticias falsas.

No todo el mundo está convencido de que utilizar chatbots para evaluar las respuestas de otros chatbots sea una gran idea. En un artículo adjunto de News and Views en Nature, Karin Verspoor, profesora de tecnologías informáticas en la Universidad RMIT en Melbourne, Australia, dijo que existen riesgos al “combatir el fuego con fuego”.

La cantidad de errores producidos por un LLM parece reducirse si un segundo chatbot agrupa las respuestas en grupos semánticamente similares, pero “usar un LLM para evaluar un método basado en LLM parece circular y podría estar sesgado”, escribió Verspoor.

“Los investigadores tendrán que lidiar con la cuestión de si este enfoque realmente controla la producción de los LLM o, sin darse cuenta, alimenta el fuego al superponer múltiples sistemas que son propensos a alucinaciones y errores impredecibles”, añadió.

Farquhar lo ve “más como construir una casa de madera con vigas transversales de madera como soporte”. “No hay nada inusual en tener componentes de refuerzo que se apoyen entre sí”, dijo.

chat GPT Chatbots de IA Inteligencia Artificial Detectar errores Universidad de Oxford Verificación de respuestas noticias de Estados Unidos

Últimas Noticias

Estas 12 ciudades de EEUU serán azotadas por una poderosa tormenta, algunas con al menos 30 centímetros de nieve

Una intensa tormenta se aproxima con condiciones de ventisca en el Atlántico Medio y el Noreste, donde cerca de 80 millones de personas esperan impactos que varían de moderados a extremos

La FDA cambia de postura y revisará la vacuna antigripal basada en ARNm de Moderna

Tras el rechazo inicial, la agencia estadounidense aceptó analizar los datos de los ensayos clínicos del inmunizante. En caso de ser aprobado, beneficiará a los adultos mayores

El déficit comercial de Estados Unidos sigue alto a pesar de la política arancelaria de Trump

El déficit comercial de bienes alcanza un récord. El comercio se desplaza de China a otros exportadores asiáticos

¿Puede la dieta cetogénica atenuar los síntomas de la esquizofrenia? Lo que dice la evidencia científica

Los posibles efectos de la dieta cetogénica en trastornos psiquiátricos como la esquizofrenia han generado debate entre investigadores y profesionales de la salud, quienes analizan los límites y alcances de la evidencia disponible en nutrición y medicina mental

La ira popular arde en Irán tras la represión, mientras Trump apuesta a que la presencia militar acelere resultados diplomáticos

Washington encamina las conversaciones nucleares con Teherán luego de la violenta reacción del régimen que mató a miles de manifestantes opositores. La indignación generalizada no ha disminuido, aseguran los iraníes

¿Puede la IA controlarse a sí misma? Los expertos dicen que los chatbots pueden detectar los errores de los demás

Investigadores de la Universidad de Oxford descubrieron que los chatbots pueden identificar inconsistencias en las respuestas de otros chatbots, lo que podría mejorar la fiabilidad de estas herramientas tecnológicas en diversos campos

Últimas Noticias

Estas 12 ciudades de EEUU serán azotadas por una poderosa tormenta, algunas con al menos 30 centímetros de nieve

Una intensa tormenta se aproxima con condiciones de ventisca en el Atlántico Medio y el Noreste, donde cerca de 80 millones de personas esperan impactos que varían de moderados a extremos

La FDA cambia de postura y revisará la vacuna antigripal basada en ARNm de Moderna

Tras el rechazo inicial, la agencia estadounidense aceptó analizar los datos de los ensayos clínicos del inmunizante. En caso de ser aprobado, beneficiará a los adultos mayores

El déficit comercial de Estados Unidos sigue alto a pesar de la política arancelaria de Trump

El déficit comercial de bienes alcanza un récord. El comercio se desplaza de China a otros exportadores asiáticos

¿Puede la dieta cetogénica atenuar los síntomas de la esquizofrenia? Lo que dice la evidencia científica

Los posibles efectos de la dieta cetogénica en trastornos psiquiátricos como la esquizofrenia han generado debate entre investigadores y profesionales de la salud, quienes analizan los límites y alcances de la evidencia disponible en nutrición y medicina mental

La ira popular arde en Irán tras la represión, mientras Trump apuesta a que la presencia militar acelere resultados diplomáticos

Washington encamina las conversaciones nucleares con Teherán luego de la violenta reacción del régimen que mató a miles de manifestantes opositores. La indignación generalizada no ha disminuido, aseguran los iraníes

Newell’s despidió a la dupla técnica Orsi-Gómez tras la dura derrota ante Banfield: el comunicado del club

El show de Cristiano Ronaldo en la goleada del Al Nassr: del premio por su doblete al festejo con una prenda que vistió Messi

Con la derrota de Independiente en Mendoza, así quedaron las tablas de posiciones del Torneo Apertura

Lautaro Midón y Guido Justo definirán el título del AAT Challenger

La desmentida del representante de Gianluca Prestianni en medio de la investigación de la UEFA por la denuncia de Vinicius

Chayanne llegó a la Argentina: cuánto tiempo se quedará y el hobby que eligió para su estadía

Evangelina Anderson celebró el cumpleaños de su hija y compartió recuerdos de su infancia: travesuras, bailes y risas

Darío Barassi celebró los 11 años de casados junto a Lucía Gómez Centurión: “La mejor decisión de mi vida”

Lourdes Fernández cumplió su sueño de cantar junto a Fabiana Cantilo y mostró el detrás de escena: “No puedo creerlo”

Gianinna Maradona y el Kun Agüero sorprendieron a Benjamín con un regalo especial: “Los 17 llegaron con llave”

INFOBAE AMÉRICA

Cómo la NASA ayudó a que las tortugas gigantes volvieran a su hábitat natural en las Islas Galápagos

Así era el “cocodrilo galgo”, el reptil que corría en tierra firme hace 215 millones de años

Qué es la terapia CAR-T y por qué puede combatir el cáncer y las enfermedades autoinmunes

La increíble historia del médico brasileño que logró sobrevivir a un cáncer avanzado en menos de un mes: “Pensé que iba a morir”

Las antiguas estatuas del Duomo de Milán siguen brillando gracias a un programa de micromecenazgo

Temas Relacionados

Últimas Noticias

Estas 12 ciudades de EEUU serán azotadas por una poderosa tormenta, algunas con al menos 30 centímetros de nieve

Una intensa tormenta se aproxima con condiciones de ventisca en el Atlántico Medio y el Noreste, donde cerca de 80 millones de personas esperan impactos que varían de moderados a extremos

La FDA cambia de postura y revisará la vacuna antigripal basada en ARNm de Moderna

Tras el rechazo inicial, la agencia estadounidense aceptó analizar los datos de los ensayos clínicos del inmunizante. En caso de ser aprobado, beneficiará a los adultos mayores

El déficit comercial de Estados Unidos sigue alto a pesar de la política arancelaria de Trump

El déficit comercial de bienes alcanza un récord. El comercio se desplaza de China a otros exportadores asiáticos

¿Puede la dieta cetogénica atenuar los síntomas de la esquizofrenia? Lo que dice la evidencia científica

Los posibles efectos de la dieta cetogénica en trastornos psiquiátricos como la esquizofrenia han generado debate entre investigadores y profesionales de la salud, quienes analizan los límites y alcances de la evidencia disponible en nutrición y medicina mental

La ira popular arde en Irán tras la represión, mientras Trump apuesta a que la presencia militar acelere resultados diplomáticos

Washington encamina las conversaciones nucleares con Teherán luego de la violenta reacción del régimen que mató a miles de manifestantes opositores. La indignación generalizada no ha disminuido, aseguran los iraníes

Newell’s despidió a la dupla técnica Orsi-Gómez tras la dura derrota ante Banfield: el comunicado del club

El show de Cristiano Ronaldo en la goleada del Al Nassr: del premio por su doblete al festejo con una prenda que vistió Messi

Con la derrota de Independiente en Mendoza, así quedaron las tablas de posiciones del Torneo Apertura

Lautaro Midón y Guido Justo definirán el título del AAT Challenger

La desmentida del representante de Gianluca Prestianni en medio de la investigación de la UEFA por la denuncia de Vinicius

Chayanne llegó a la Argentina: cuánto tiempo se quedará y el hobby que eligió para su estadía

Evangelina Anderson celebró el cumpleaños de su hija y compartió recuerdos de su infancia: travesuras, bailes y risas

Darío Barassi celebró los 11 años de casados junto a Lucía Gómez Centurión: “La mejor decisión de mi vida”

Lourdes Fernández cumplió su sueño de cantar junto a Fabiana Cantilo y mostró el detrás de escena: “No puedo creerlo”

Gianinna Maradona y el Kun Agüero sorprendieron a Benjamín con un regalo especial: “Los 17 llegaron con llave”

INFOBAE AMÉRICA

Cómo la NASA ayudó a que las tortugas gigantes volvieran a su hábitat natural en las Islas Galápagos

Así era el “cocodrilo galgo”, el reptil que corría en tierra firme hace 215 millones de años

Qué es la terapia CAR-T y por qué puede combatir el cáncer y las enfermedades autoinmunes

La increíble historia del médico brasileño que logró sobrevivir a un cáncer avanzado en menos de un mes: “Pensé que iba a morir”

Las antiguas estatuas del Duomo de Milán siguen brillando gracias a un programa de micromecenazgo