La IA aplicada a la medicina: ¿puede un chatbot superar un examen cognitivo humano?

Un equipo de neurólogos evaluó modelos de IA con un test clínico para detectar deterioro mental. Según Newsweek, los resultados fueron sorprendentes y abren el debate sobre el rol de la tecnología en la salud

Guardar
Pantalla de una laptop mostrando la interfaz de un chatbot impulsado por Inteligencia Artificial, con líneas de código destacadas. La imagen refleja el impacto de la IA en la evolución tecnológica, simbolizando los avances en programación, robótica y asistencia digital en el campo científico y tecnológico. (Imagen ilustrativa Infobae)
Un estudio israelí evalúa la cognición de chatbots de IA con pruebas diseñadas para humanos y revela limitaciones clave (Imagen ilustrativa Infobae)

En Israel, un equipo de neurólogos sometió a los principales chatbots de inteligencia artificial (IA) a un examen cognitivo utilizado para evaluar la salud mental de los presidentes de Estados Unidos. Lo que comenzó como una broma reveló fallos inesperados en la tecnología, cada vez más utilizada en la toma de decisiones clínicas.

La investigación -publicada en diciembre de 2024 en la edición navideña de la revista médica BMJ- plantea preguntas sobre los límites de la IA en el ámbito de la salud y la importancia insustituible de la empatía humana en la práctica médica.

IA vs cognición humana: un experimento revelador

El estudio, dirigido por el neurólogo Roy Dayan, del Centro Médico Hadassah de Jerusalén, surgió como una respuesta al creciente entusiasmo por la IA en el diagnóstico médico.

Investigaciones recientes han demostrado que herramientas como ChatGPT pueden aprobar exámenes médicos de alto nivel y, en algunos casos, ofrecer diagnósticos más precisos que los propios médicos.

Incluso una encuesta realizada en junio de 2024 por la firma de consultoría Customertimes reveló que un 10% de los consumidores cree que la IA debería reemplazar a los médicos en un futuro próximo.

Con esta premisa, Dayan y sus colegas decidieron evaluar las capacidades cognitivas de cinco modelos líderes de IA: ChatGPT-4, GPT-4o, Claude, Gemini 1 y Gemini 1.5.

cerebro, materia gris, materia blanca, mind, centro cognitivo, inteligencia, neuronas - Imagen Ilustrativa Infobae
ChatGPT y cuatro modelos de IA destacan en memoria y atención, pero fallan en tareas visuoespaciales según la Evaluación Cognitiva de Montreal (Imagen Ilustrativa Infobae)

Para ello, aplicaron la Evaluación Cognitiva de Montreal (MOCA), una prueba utilizada para detectar deterioro cognitivo en humanos. La evaluación incluye tareas como copiar un dibujo de un cubo, generar palabras que comiencen con la misma letra y realizar cálculos matemáticos simples.

Para sorpresa de los investigadores, ninguno de los modelos alcanzó la puntuación máxima de 30 puntos. La mayoría obtuvo entre 18 y 25 puntos, un rango que en pacientes humanos se asocia con deterioro cognitivo leve o demencia temprana.

Aunque los chatbots sobresalieron en pruebas de memoria y atención, fallaron en tareas visuoespaciales, como la representación gráfica de objetos y la orientación en el espacio.

Otro resultado llamativo fue la evaluación de la empatía. Los investigadores mostraron a los modelos la ilustración “Robo de galletas”, una prueba del Examen de Diagnóstico de Afasia de Boston, que consiste en interpretar una escena donde un niño está a punto de caerse mientras roba galletas.

Si bien todos los modelos describieron elementos de la imagen, ninguno mencionó el peligro inminente del niño. Según los autores del estudio, esta carencia de percepción del riesgo se asemeja a los síntomas de la demencia frontotemporal, que afecta la toma de decisiones y la capacidad de sentir empatía.

El factor humano: diagnóstico y empatía en la medicina

Más allá de los resultados humorísticos del estudio, la investigación pone de relieve una cuestión crucial: la inteligencia artificial no percibe el mundo como los humanos.

En especial, carece de elementos clave en la práctica médica, como la interpretación del lenguaje corporal y la modulación de la voz del paciente, factores fundamentales en el diagnóstico clínico.

(Imagen Ilustrativa Infobae)
Herramientas de inteligencia artificial obtienen resultados precisos en exámenes médicos, pero carecen del factor humano fundamental en salud (Imagen Ilustrativa Infobae)

“Cuando examino a un paciente, no solo escucho lo que dice, sino cómo lo dice”, explicó Dayan en una entrevista con Newsweek. “La IA puede responder preguntas médicas con precisión, pero no puede notar el nerviosismo en la voz de un paciente, ni detectar señales sutiles en su postura”.

La empatía es otro aspecto insustituible. Un estudio publicado en 2024 sobre pacientes con dolor crónico reveló que la empatía del médico estaba más relacionada con una recuperación favorable que tratamientos convencionales como opioides o cirugía de columna. La interacción humana no solo aporta un diagnóstico, sino que puede influir directamente en la salud del paciente.

Opiniones encontradas: ¿un niño prodigio o una máquina defectuosa?

El estudio ha generado reacciones mixtas en la comunidad médica. Para el Dr. Robert Pearl, exdirector de Permanente Medical Group y profesor en la Universidad de Stanford, las deficiencias de la IA no se asemejan al deterioro cognitivo en ancianos, sino al proceso de aprendizaje en niños.

“Si ChatGPT tiene este nivel de inteligencia a los dos años de su lanzamiento, imaginemos su potencial en cinco años”, comentó Pearl a Newsweek.

El ve la IA como un estudiante de medicina en formación: útil para analizar información, pero no lo suficientemente confiable para diagnosticar y tratar pacientes sin supervisión.

De hecho, en su libro ChatGPT, MD, publicado en 2024, relata cómo colaboró con la IA como si fuera un asistente de investigación, encontrando que el 98% de la información proporcionada era excelente, pero el 2% restante contenía errores graves.

Pantalla de una laptop mostrando la interfaz de un chatbot impulsado por Inteligencia Artificial, con líneas de código destacadas. La imagen refleja el impacto de la IA en la evolución tecnológica, simbolizando los avances en programación, robótica y asistencia digital en el campo científico y tecnológico. (Imagen ilustrativa Infobae)
Expertos como Robert Pearl ven a la IA como un estudiante médico en desarrollo con gran potencial futuro (Imagen ilustrativa Infobae)

Otros expertos, como el Dr. Thomas Thesen, neurocientífico de la Escuela de Medicina de Dartmouth, creen que el estudio de BMJ resalta una cuestión importante: la IA no debe evaluarse con las mismas herramientas diseñadas para humanos.

“Es como pedirle a una calculadora que haga flexiones”, comparó Thesen en declaraciones a Newsweek. No obstante, reconoció que la IA puede desempeñar un papel en la formación médica, por ejemplo, en simulaciones de interacciones con pacientes.

El futuro de la IA en la medicina: ¿herramienta o sustituto?

Si bien la IA ha demostrado ser una herramienta valiosa en la medicina, la idea de que pueda reemplazar por completo a los médicos sigue siendo cuestionable.

Como señala la Dra. Roshini Pinto-Powell, de la Escuela de Medicina de Dartmouth, la empatía médica va más allá del reconocimiento del sufrimiento: implica la motivación de actuar para aliviarlo. Según ella, esta capacidad de la mente humana es insustituible.

Al final, la pregunta no es si la IA superará a los médicos en conocimientos técnicos, sino si podrá replicar el vínculo humano esencial en la práctica médica. Y, por ahora, la respuesta parece ser un rotundo no.

Últimas Noticias

Cómo el cerebro puede interpretar en segundos lo que ve

La investigación, realizada en modelos animales, sugiere que la mente transforma la información sensorial en resúmenes útiles, lo que mejora tanto la percepción como la toma de decisiones en escenarios complejos

Cómo el cerebro puede interpretar en segundos lo que ve

Poliamida PA6F: cómo funciona el innovador material que promete eliminar los “químicos eternos” del agua

La nueva tecnología desarrollada por científicos británicos permite retener y remover contaminantes persistentes en procesos de purificación, aportando una alternativa sostenible a los métodos tradicionales de tratamiento de efluentes

Poliamida PA6F: cómo funciona el innovador material que promete eliminar los “químicos eternos” del agua

Por qué la cara se enrojece al correr y cuándo puede ser un síntoma de alerta

El fenómeno suele ser inofensivo y forma parte de la adaptación corporal al esfuerzo. No obstante, algunas señales pueden indicar la necesidad de detener el ejercicio y buscar ayuda profesional

Por qué la cara se enrojece al correr y cuándo puede ser un síntoma de alerta

Vivir más no es un secreto: 5 hábitos respaldados por la ciencia inspirados en la longevidad mediterránea

El análisis de estilos de vida en regiones del sur de Europa permitió identificar prácticas cotidianas que explican por qué ciertas poblaciones alcanzan edades avanzadas en mejores condiciones físicas y emocionales que el promedio mundial, según expertos consultados por Vogue

Vivir más no es un secreto: 5 hábitos respaldados por la ciencia inspirados en la longevidad mediterránea

Qué es el método de activación continua, el ejercicio inspirado en astronautas que previene el dolor de espalda

Inspirado en los entrenamientos de la NASA, el método prioriza movimientos lentos y controlados para fortalecer los músculos estabilizadores de la columna y puede integrarse a la fisioterapia y las rutinas diarias. Qué tener en cuenta

Qué es el método de activación continua, el ejercicio inspirado en astronautas que previene el dolor de espalda