¿Puede la IA controlarse a sí misma? Los expertos dicen que los chatbots pueden detectar los errores de los demás

Guardar

Investigadores de Oxford usan chatbots para detectar errores en respuestas de otros chatbots. (Imagen Ilustrativa Infobae)

Los chatbots de IA se sienten cada vez más cómodos en el arte de la conversación humana. El problema, dicen los expertos, es que son propensos a dar respuestas inexactas o sin sentido, lo que se conoce como “alucinaciones”. Ahora, los investigadores han encontrado una posible solución: usar chatbots para detectar errores que otros chatbots han cometido.

Sebastian Farquhar, científico informático de la Universidad de Oxford, es coautor de un estudio publicado el miércoles en la revista Nature que postula que los chatbots como ChatGPT o Gemini de Google pueden usarse para eliminar falsedades de la IA.

Los chatbots utilizan grandes modelos de lenguaje, o LLM, que consumen grandes cantidades de texto de Internet y pueden usarse para diversas tareas, incluida la generación de texto prediciendo la siguiente palabra en una oración. Los robots encuentran patrones mediante prueba y error, y luego se utiliza la retroalimentación humana para ajustar el modelo. Pero hay un inconveniente: los chatbots no pueden pensar como humanos y no entienden lo que dicen.

Chatbots pueden identificar inconsistencias en respuestas generadas por otros sistemas de IA. (EFE/ Wu Hao)

Para probar esto, Farquhar y sus colegas hicieron preguntas a un chatbot y luego utilizaron un segundo chatbot para revisar las respuestas en busca de inconsistencias, de manera similar a la forma en que la policía podría intentar hacer tropezar a un sospechoso haciéndole la misma pregunta una y otra vez. Si las respuestas tenían significados muy diferentes, eso significaba que probablemente estaban confusas.

Dijo que al chatbot se le hizo una serie de preguntas de trivia comunes, así como problemas planteados de matemáticas de la escuela primaria.

Los investigadores verificaron la precisión de la evaluación del chatbot comparándola con la evaluación humana en el mismo subconjunto de preguntas. Descubrieron que el chatbot coincidía con los evaluadores humanos el 93% de las veces, mientras que los evaluadores humanos coincidían entre sí el 92% de las veces, lo suficientemente cerca como para que los chatbots que se evaluaban entre sí “no fueran preocupantes”, dijo Farquhar.

Farquhar dijo que para el lector medio, identificar algunos errores de la IA es “bastante difícil”. A menudo tiene dificultades para detectar tales anomalías cuando utiliza LLM para su trabajo porque los chatbots “a menudo te dicen lo que quieres escuchar, inventan cosas que no solo son plausibles, sino que serían útiles si fueran ciertas, algo que los investigadores han etiquetado como ‘adulación’”, dijo en un correo electrónico.

Hombre trabajando con laptop e inteligencia artificial, sumergiéndose en el mundo digital. Conexión a internet, productividad, machine learning y software avanzado en acción. (Imagen ilustrativa Infobae)

Uso de un segundo chatbot mejora la fiabilidad de las respuestas según el estudio.(Imagen ilustrativa Infobae)

Las respuestas poco confiables son una barrera para la adopción generalizada de chatbots de IA, especialmente en campos médicos como la radiología, donde “podrían representar un riesgo para la vida humana”, dijeron los investigadores. También podrían dar lugar a precedentes legales inventados o noticias falsas.

No todo el mundo está convencido de que utilizar chatbots para evaluar las respuestas de otros chatbots sea una gran idea. En un artículo adjunto de News and Views en Nature, Karin Verspoor, profesora de tecnologías informáticas en la Universidad RMIT en Melbourne, Australia, dijo que existen riesgos al “combatir el fuego con fuego”.

La cantidad de errores producidos por un LLM parece reducirse si un segundo chatbot agrupa las respuestas en grupos semánticamente similares, pero “usar un LLM para evaluar un método basado en LLM parece circular y podría estar sesgado”, escribió Verspoor.

“Los investigadores tendrán que lidiar con la cuestión de si este enfoque realmente controla la producción de los LLM o, sin darse cuenta, alimenta el fuego al superponer múltiples sistemas que son propensos a alucinaciones y errores impredecibles”, añadió.

Farquhar lo ve “más como construir una casa de madera con vigas transversales de madera como soporte”. “No hay nada inusual en tener componentes de refuerzo que se apoyen entre sí”, dijo.

chat GPT Chatbots de IA Inteligencia Artificial Detectar errores Universidad de Oxford Verificación de respuestas noticias de Estados Unidos

Últimas Noticias

Los rescatistas del terremoto en Venezuela creen que un niño de 9 años está vivo bajo los escombros tras más de 16 días

Los sismos de magnitud 7.2 y 7.5, que ocurrieron con 39 segundos de diferencia el 24 de junio, destruyeron cientos de edificios, causaron la muerte de más de 4.000 personas y dejaron a miles de desaparecidos

Por qué esta podría ser la temporada de huracanes menos activa en 13 años

Un informe de la Universidad Estatal de Colorado estima apenas nueve sistemas con nombre, muy por debajo del promedio, y reduce a 17 % la opción de un impacto fuerte en Estados Unidos pese a que el riesgo no desaparece

Graham Platner puso fin a su campaña para el Senado de Estados Unidos en Maine

El candidato demócrata se retiró de la contienda tras una acusación de agresión sexual. Su partido en Maine tienen hasta el 27 de julio para elegir a un candidato sustituto que se enfrente a la senadora republicana Susan Collins

Fiebre oceánica: el Pacífico alcanza temperaturas récord y pone en alerta a científicos

Una ola de calor marina sin precedentes cubre más del 13 por ciento de la superficie de la Tierra en el Océano Pacífico, con posibles consecuencias severas en el clima global durante los próximos meses

Más allá del Campamento Mystic, los supervivientes de las inundaciones de Texas luchan por salir adelante

Tras la tragedia que dejó al menos 137 muertos, la región intenta sostener el turismo mientras persisten campamentos cerrados, demandas, pérdidas materiales y la búsqueda de una niña que aún no termina

¿Puede la IA controlarse a sí misma? Los expertos dicen que los chatbots pueden detectar los errores de los demás

Investigadores de la Universidad de Oxford descubrieron que los chatbots pueden identificar inconsistencias en las respuestas de otros chatbots, lo que podría mejorar la fiabilidad de estas herramientas tecnológicas en diversos campos

Últimas Noticias

Los rescatistas del terremoto en Venezuela creen que un niño de 9 años está vivo bajo los escombros tras más de 16 días

Los sismos de magnitud 7.2 y 7.5, que ocurrieron con 39 segundos de diferencia el 24 de junio, destruyeron cientos de edificios, causaron la muerte de más de 4.000 personas y dejaron a miles de desaparecidos

Por qué esta podría ser la temporada de huracanes menos activa en 13 años

Un informe de la Universidad Estatal de Colorado estima apenas nueve sistemas con nombre, muy por debajo del promedio, y reduce a 17 % la opción de un impacto fuerte en Estados Unidos pese a que el riesgo no desaparece

Graham Platner puso fin a su campaña para el Senado de Estados Unidos en Maine

El candidato demócrata se retiró de la contienda tras una acusación de agresión sexual. Su partido en Maine tienen hasta el 27 de julio para elegir a un candidato sustituto que se enfrente a la senadora republicana Susan Collins

Fiebre oceánica: el Pacífico alcanza temperaturas récord y pone en alerta a científicos

Una ola de calor marina sin precedentes cubre más del 13 por ciento de la superficie de la Tierra en el Océano Pacífico, con posibles consecuencias severas en el clima global durante los próximos meses

Más allá del Campamento Mystic, los supervivientes de las inundaciones de Texas luchan por salir adelante

Tras la tragedia que dejó al menos 137 muertos, la región intenta sostener el turismo mientras persisten campamentos cerrados, demandas, pérdidas materiales y la búsqueda de una niña que aún no termina

DEPORTES

Argentina-Suiza, en vivo por los cuartos de final del Mundial 2026: Scaloni repetirá el equipo del último partido

La gran polémica del Mundial: Noruega reclamó que la pelota pegó en un cable de la cámara de TV antes del empate de Inglaterra

Inglaterra venció 2-1 a Noruega en tiempo extra y espera en semifinales del Mundial 2026 por Argentina o Suiza

Inglaterra espera por Argentina o Suiza: así están el cuadro de semifinales del Mundial 2026 y la agenda completa hasta la final

El hostil trato a Gianluca Prestianni en el amistoso Benfica-Flamengo tras el escándalo con Vinícius Jr.

TELESHOW

Malena Guinzburg celebró su quinto aniversario con Adrián Montesoro: “El amor de mi vida”

Las vacaciones de Cinthia Fernández y Roberto Castillo en Bariloche: día de ski, cabaña y romance en la nieve

Así vivió Eva Bargiela la previa del partido de Argentina y Suiza

Mirtha Legrand se animó a publicar su frase ‘prohibida’ para alentar a la Scaloneta antes del duelo con Suiza

Wanda Nara aterrizó en París con Martín Migueles y cuatro de sus hijos: helados, café y hotel de lujo

INFOBAE AMÉRICA

La población silenciosa: inteligencia artificial en la vejez, entre el apoyo cotidiano y el riesgo de un nuevo abandono

Estados Unidos lanzó nuevos ataques contra objetivos militares del régimen de Irán

Irán aumenta la tensión con EEUU: la Guardia Revolucionaria anunció el cierre del estrecho de Ormuz “hasta nuevo aviso”

Honduras: Fiscal General fortalece cooperación con la DEA para combatir el narcotráfico y el crimen organizado

Niño de 4 años es hospitalizado tras ser mordido por una serpiente tamagás en Honduras

Temas Relacionados

Últimas Noticias

Los rescatistas del terremoto en Venezuela creen que un niño de 9 años está vivo bajo los escombros tras más de 16 días

Los sismos de magnitud 7.2 y 7.5, que ocurrieron con 39 segundos de diferencia el 24 de junio, destruyeron cientos de edificios, causaron la muerte de más de 4.000 personas y dejaron a miles de desaparecidos

Por qué esta podría ser la temporada de huracanes menos activa en 13 años

Un informe de la Universidad Estatal de Colorado estima apenas nueve sistemas con nombre, muy por debajo del promedio, y reduce a 17 % la opción de un impacto fuerte en Estados Unidos pese a que el riesgo no desaparece

Graham Platner puso fin a su campaña para el Senado de Estados Unidos en Maine

El candidato demócrata se retiró de la contienda tras una acusación de agresión sexual. Su partido en Maine tienen hasta el 27 de julio para elegir a un candidato sustituto que se enfrente a la senadora republicana Susan Collins

Fiebre oceánica: el Pacífico alcanza temperaturas récord y pone en alerta a científicos

Una ola de calor marina sin precedentes cubre más del 13 por ciento de la superficie de la Tierra en el Océano Pacífico, con posibles consecuencias severas en el clima global durante los próximos meses

Más allá del Campamento Mystic, los supervivientes de las inundaciones de Texas luchan por salir adelante

Tras la tragedia que dejó al menos 137 muertos, la región intenta sostener el turismo mientras persisten campamentos cerrados, demandas, pérdidas materiales y la búsqueda de una niña que aún no termina

DEPORTES

Argentina-Suiza, en vivo por los cuartos de final del Mundial 2026: Scaloni repetirá el equipo del último partido

La gran polémica del Mundial: Noruega reclamó que la pelota pegó en un cable de la cámara de TV antes del empate de Inglaterra

Inglaterra venció 2-1 a Noruega en tiempo extra y espera en semifinales del Mundial 2026 por Argentina o Suiza

Inglaterra espera por Argentina o Suiza: así están el cuadro de semifinales del Mundial 2026 y la agenda completa hasta la final

El hostil trato a Gianluca Prestianni en el amistoso Benfica-Flamengo tras el escándalo con Vinícius Jr.

TELESHOW

Malena Guinzburg celebró su quinto aniversario con Adrián Montesoro: “El amor de mi vida”

Las vacaciones de Cinthia Fernández y Roberto Castillo en Bariloche: día de ski, cabaña y romance en la nieve

Así vivió Eva Bargiela la previa del partido de Argentina y Suiza

Mirtha Legrand se animó a publicar su frase ‘prohibida’ para alentar a la Scaloneta antes del duelo con Suiza

Wanda Nara aterrizó en París con Martín Migueles y cuatro de sus hijos: helados, café y hotel de lujo

INFOBAE AMÉRICA

La población silenciosa: inteligencia artificial en la vejez, entre el apoyo cotidiano y el riesgo de un nuevo abandono

Estados Unidos lanzó nuevos ataques contra objetivos militares del régimen de Irán

Irán aumenta la tensión con EEUU: la Guardia Revolucionaria anunció el cierre del estrecho de Ormuz “hasta nuevo aviso”

Honduras: Fiscal General fortalece cooperación con la DEA para combatir el narcotráfico y el crimen organizado

Niño de 4 años es hospitalizado tras ser mordido por una serpiente tamagás en Honduras