La IA supera a los médicos de urgencias en los ensayos de diagnóstico, pero los investigadores advierten contra la sustitución de los humanos

по

04.05.2026

Un estudio innovador publicado en Science revela que la inteligencia artificial avanzada puede superar a los médicos humanos de las salas de emergencia a la hora de diagnosticar pacientes y determinar los planes de tratamiento. Sin embargo, los investigadores detrás de los hallazgos enfatizan que este salto tecnológico no significa el fin del papel del médico humano. En cambio, destaca la necesidad urgente de estándares regulatorios más estrictos y un cambio hacia modelos de atención colaborativa donde la IA apoye, en lugar de reemplazar, el juicio clínico.

El estudio: IA versus médicos humanos

La investigación, dirigida por Arjun Manrai, profesor asistente de Informática Biomédica en la Facultad de Medicina de Harvard, probó el modelo de lenguaje grande (LLM) de la serie o1 de OpenAI con una base de referencia de médicos en ejercicio activo y certificados. Los experimentos utilizaron una combinación de casos clínicos estandarizados y datos del mundo real de pacientes seleccionados al azar del departamento de emergencias de un centro médico en Massachusetts.

Los resultados fueron sorprendentes. En tareas que van desde la clasificación inicial hasta las opciones de diagnóstico finales y los pasos de gestión, el modelo de IA igualó o superó el desempeño humano. La ventaja del modelo fue más pronunciada en la etapa inicial de clasificación, una fase crítica en la que se deben tomar decisiones con información limitada. Si bien tanto los médicos humanos como la IA mejoraron su precisión a medida que hubo más datos disponibles, el LLM demostró una capacidad superior para manejar la incertidumbre, procesando eficazmente notas de salud fragmentadas o desestructuradas que a menudo caracterizan escenarios de emergencia del mundo real.

“En pocas palabras, el modelo superó a nuestra gran base de médicos. Verá esto en detalle, pero esto incluía médicos certificados, que practicaban activamente y casos reales confusos”, afirmó Manrai durante una conferencia de prensa virtual.

Por qué esto es importante: más allá de los titulares

Si bien la comparación que acapara los titulares sugiere que la IA es “mejor” que los médicos, el contexto tiene matices. Este estudio representa una evolución significativa con respecto a enfoques algorítmicos anteriores, que anteriormente estaban rezagados con respecto a los médicos humanos. Lo que distingue a esta investigación es su escala y su comparación directa y directa en un entorno clínico realista.

Sin embargo, los hallazgos plantean preguntas críticas sobre el futuro de la atención médica:

Los límites de la IA basada en texto: El trabajo clínico real depende en gran medida de señales visuales y auditivas, como el tono de voz, el color de la piel o la forma de andar del paciente, que los LLM actuales basados en texto no pueden interpretar. El estudio señala que las investigaciones futuras deben centrarse en cómo los humanos y las máquinas pueden colaborar utilizando estas señales no textuales.
Seguridad y equidad: El estudio actual no evaluó si la atención asistida por IA es segura, equitativa o rentable. Estos son factores esenciales para una adopción generalizada.
Deficiencias regulatorias: Como advirtió Manrai: “No creo que nuestros hallazgos signifiquen que la IA reemplace a los médicos… Creo que sí significa que estamos siendo testigos de un cambio realmente profundo en la tecnología que remodelará la medicina, y que necesitamos evaluar esta tecnología ahora y realizar rigurosamente ensayos clínicos prospectivos”.

Un llamado a una supervisión rigurosa

El estudio sirve como catalizador para debates más amplios sobre la política sanitaria. Ashley M. Hopkins y Eric Cornelisse, investigadores de la Universidad de Flinders en Australia, publicaron un comentario en Science junto con el estudio, argumentando que los sistemas de IA deben cumplir con los mismos estándares rigurosos que los profesionales humanos.

“No permitimos que los médicos ejerzan sin supervisión y evaluación, y la IA debe cumplir estándares comparables”, afirmó Cornelisse. Esto implica que los reguladores, hospitales y proveedores de atención médica deben colaborar para establecer marcos de prueba sólidos antes de implementar estas herramientas en entornos clínicos. El objetivo es garantizar que la IA mejore la atención al paciente sin introducir nuevos riesgos o disparidades.

Conclusión

Este estudio marca un momento crucial en la tecnología médica y demuestra que la IA puede manejar tareas de diagnóstico complejas con mayor eficiencia que los médicos humanos en contextos específicos. Sin embargo, el consenso entre los expertos es claro: la IA es una poderosa herramienta de colaboración, no un sustituto. La prioridad inmediata para la industria de la salud es desarrollar estándares de evaluación rigurosos y protocolos de seguridad para integrar esta tecnología de manera responsable, garantizando que sirva tanto a los médicos como a los pacientes de manera efectiva.