¿Qué tan preciso es ChatGPT cuando se le pregunta sobre la salud?

Healthday Spanish

Guardar

MARTES, 5 de agosto de 2025 (HealthDay News) -- Es probable que ChatGPT sea impredecible cuando se trata de averiguar los síntomas de una enfermedad en particular, señala un estudio reciente.

El programa de IA tiene una precisión del 49% al 61% cuando se trata de identificar síntomas asociados con enfermedades específicas, informaron investigadores recientemente en la revista iScience.

Esto podría tener que ver con cómo se entrenan las IA como ChatGPT, dijo el investigador principal Ahmed Abdeen Hamed, investigador en ciencia de sistemas e ingeniería industrial en la Universidad de Binghamton, Universidad Estatal de Nueva York.

ChatGPT es un gran modelo de lenguaje, un tipo de IA que aprende analizando grandes cantidades de texto. Pero podría estar tropezando con la jerga médica utilizada por los médicos, dijo Hamed en un comunicado de prensa.

"ChatGPT usa un lenguaje más amigable y social, porque se supone que se comunica con la gente promedio", dijo Hamed. "En la literatura médica, la gente usa nombres propios".

Por ejemplo, ChatGPT tropieza al hacer coincidir el "estado de ánimo triste" con la "depresión", el "enrojecimiento facial" con la "inflamación" o las "convulsiones" con la "convulsión febril", dice el estudio.

"Aparentemente, el LLM está tratando de simplificar la definición de estos síntomas, porque hay mucho tráfico haciendo tales preguntas, por lo que comenzó a minimizar las formalidades del lenguaje médico para atraer a esos usuarios", dijo Hamed.

Por otro lado, ChatGPT fue excelente para identificar cosas para las que la jerga médica coincide con la jerga cotidiana, como términos de enfermedades, nombres de medicamentos e información genética, dijeron los investigadores.

Hamed había pensado que ChatGPT tendría "como máximo un 25% de precisión" cuando se probara en esos asuntos.

Pero la IA tuvo una precisión del 88% al 97% en la identificación de términos de enfermedades, del 90% al 91% en la comprensión de los nombres de los medicamentos y del 88% al 98% en la evaluación de la información genética, según muestran los resultados.

"El resultado emocionante fue que ChatGPT dijo que el cáncer es una enfermedad, la hipertensión es una enfermedad, la fiebre es un síntoma, Remdesivir es un medicamento y BRCA es un gen relacionado con el cáncer de mama", dijo Hamed. "¡Increíble, absolutamente increíble!"

Hamed dijo que está investigando la capacidad de la IA para responder preguntas médicas, porque muchos están recurriendo a los programas en busca de consejos rápidos.

"La gente habla con ChatGPT todo el tiempo en estos días y dice: 'Tengo estos síntomas. ¿Tengo cáncer? ¿Tengo un paro cardíaco? ¿Debería recibir tratamiento?'". Dijo Hamed.

"Puede ser un negocio muy peligroso, por lo que queríamos ver qué pasaría si hiciéramos estas preguntas, qué tipo de respuestas obtuvimos y cómo estas respuestas podrían verificarse a partir de la literatura biomédica", dijo Hamed.

El objetivo de Hamed es exponer estas fallas para que los modelos puedan ajustarse para obtener mejores respuestas.

"Si estoy analizando el conocimiento, quiero asegurarme de eliminar cualquier cosa que pueda parecer sospechosa antes de construir mis teorías y hacer algo que no sea preciso", dijo.

Por ejemplo, ChatGPT quedó completamente desconcertado cuando se le hicieron preguntas sobre los datos almacenados en GenBank, una base de datos de los Institutos Nacionales de Salud que asigna un número a cada secuencia de ADN identificada, como NM_007294.4 para el gen del cáncer de mama BRCA1.

Cuando se le preguntó por estos números como parte de sus pruebas de información genética, ChatGPT simplemente los inventó de la nada, un fenómeno conocido como "alucinaciones", dijo Hamed.

"Tal vez haya una oportunidad aquí en la que podamos comenzar a introducir (jerga médica) a los LLM para proporcionar una precisión mucho mayor, deshacernos de todas las alucinaciones y convertir estas herramientas en algo increíble", dijo.

Más información

La Clínica Cleveland tiene más información sobre la IA en el cuidado de la salud.

FUENTES: Universidad de Binghamton, Universidad Estatal de Nueva York, comunicado de prensa, 20 de junio de 2025; iScience, 20 de junio de 2025

Últimas Noticias

Por qué investigadores recomiendan comer dos kiwis al día y cuáles son los efectos en la salud cutánea, intestinal y cardiovascular

Un informe realizado por The Times, basado en estudios y expertos, reveló cómo la incorporación de esta fruta en la rutina diaria podría influir en la función digestiva, el bienestar de la piel y el cuidado del corazón

Por qué investigadores recomiendan comer

Un estudio mostró cómo el amor materno deja huella en el cerebro de los caballos

Un estudio en Francia demostró que los potrillos que permanecen junto a sus progenitoras desarrollan mayor sociabilidad, exploran más y muestran menores niveles de estrés. Por qué el hallazgo puede impulsar nuevas prácticas en bienestar animal

Un estudio mostró cómo el

Las señales silenciosas de que tu cuerpo no está recibiendo suficiente proteína

Expertos consultados por la revista Time señalan que muchas personas no alcanzan los niveles óptimos de este macronutriente sin advertirlo. Cómo identificar los síntomas tempranos y qué pautas ayudan a prevenir déficits a largo plazo

Las señales silenciosas de que

Identifican una transformación clave en el ARN del esperma relacionado con la edad paterna

Científicos de Estados Unidos y China aplicaron tecnología de secuenciación en muestras de humanos y ratones. ¿El envejecimiento masculino puede afectar el bienestar de los hijos?

Identifican una transformación clave en

Súper gripe H3N2 en Argentina: ya se detectaron 28 casos en 14 provincias

La cantidad de diagnósticos confirmados de influenza A(H3N2) subclado K se duplicó en la última semana. Quiénes son los más afectados y cuál es el dato que preocupa a los especialistas

Súper gripe H3N2 en Argentina: