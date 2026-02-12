Tecno

La Universidad de Oxford revela los riesgos de usar ChatGPT y otras IA para buscar ayuda médica

Según los resultados de la investigación, estos sistemas no mejoran la toma de decisiones frente a métodos tradicionales

Equipo de la Universidad de Oxford analizó el impacto de la inteligencia artificial en la atención médica de pacientes. (Imagen Ilustrativa Infobae)

Un estudio de la Universidad de Oxford publicado en la revista ‘Nature Medicine’ advierte que la inteligencia artificial, incluyendo sistemas como ChatGPT, puede generar riesgos al sustituir el consejo médico profesional. El informe subraya que estos sistemas no están preparados para reemplazar la labor de un médico en la atención de consultas de salud.

La investigación, dirigida por el Oxford Internet Institute y el Departamento Nuffield de Ciencias de la Salud de Atención Primaria de la mencionada universidad, analizó el uso de modelos lingüísticos de inteligencia artificial (LLM) para resolver escenarios médicos.

El trabajo fue realizado junto a MLCommons y otras instituciones internacionales. Los expertos detectaron una importante brecha entre el rendimiento que muestran los sistemas de IA en exámenes estandarizados y su efectividad cuando los utilizan personas para resolver dudas de salud.

Los investigadores advierten sobre diagnósticos erróneos y falta de reconocimiento de urgencias en la IA. (Imagen Ilustrativa Infobae)

El ensayo involucró a casi 1.300 médicos que recibieron una serie de casos clínicos simulados, desde dolores de cabeza intensos tras una noche de fiesta hasta síntomas persistentes de agotamiento en madres primerizas. Un grupo consultó una IA para decidir cómo actuar ante los síntomas, mientras el otro recurrió a búsquedas en línea o a su propio juicio clínico.

Los resultados mostraron que los usuarios que confiaron en modelos como ChatGPT no tomaron mejores decisiones que quienes usaron métodos tradicionales.

Diagnósticos erróneos y falta de reconocimiento de urgencias

El informe indica que los sistemas de inteligencia artificial pueden fallar al ofrecer un diagnóstico adecuado y no logran identificar cuándo un caso requiere atención urgente. La doctora Rebecca Payne, médica de cabecera y líder del estudio en el Departamento Nuffield, señaló que la IA aún no está lista para asumir el rol del médico.

Los pacientes deben ser conscientes de que preguntar a un modelo de lenguaje extenso sobre sus síntomas puede ser peligroso, ya que puede dar diagnósticos erróneos y no reconocer cuándo se necesita ayuda urgente.

Casi 1.300 médicos participaron en el estudio simulando casos clínicos reales. (Imagen Ilustrativa Infobae)

Los investigadores identificaron que el método actual de evaluación de estos sistemas, basado en pruebas de referencia sin interacción con usuarios reales, no refleja la complejidad de la comunicación humana. Por ejemplo, muchos participantes del estudio no sabían qué información necesitaban proporcionar al modelo para recibir una respuesta precisa. Esto llevó a que la inteligencia artificial emitiera recomendaciones mixtas, dificultando la elección de la mejor alternativa.

El autor principal, Andrew Bean, estudiante de doctorado en el Oxford Internet Institute, subrayó la necesidad de ensayos más robustos. Diseñar pruebas robustas para modelos lingüísticos extensos es fundamental para comprender cómo se puede aprovechar esta nueva tecnología. El estudio demostró que interactuar con humanos supone un desafío incluso para los modelos más avanzados.

El desafío de evaluar la inteligencia artificial en salud

El estudio de Oxford concluye que se requiere un enfoque más riguroso para evaluar los sistemas de inteligencia artificial en medicina. Adam Mahdi, profesor asociado del Oxford Internet Institute y coautor principal, planteó que los métodos de validación actuales no son suficientes para determinar la seguridad de estos sistemas en situaciones reales.

El trabajo señala la necesidad de validar la inteligencia artificial con pruebas en usuarios reales. (Imagen ilustrativa Infobae)

No se puede basar únicamente en pruebas estandarizadas para determinar si estos sistemas son seguros para el uso público. Al igual que se exigen ensayos clínicos para nuevos medicamentos, los sistemas de IA necesitan pruebas rigurosas con usuarios reales y diversos para comprender sus verdaderas capacidades en entornos de alto riesgo como la atención médica.

El trabajo resalta que el uso de inteligencia artificial para buscar ayuda médica puede implicar riesgos importantes si los sistemas no han sido validados en el mundo real. El equipo de Oxford sugiere que, mientras se desarrollan mejores métodos de evaluación, los pacientes deben mantener la consulta médica tradicional como la vía principal para resolver dudas de salud.

