Skip to main content

Este sitio web está dirigido a profesionales sanitarios que ejercen en España

Los modelos de lenguaje específicos para medicina son LLMs reentrenados con corpus biomédico que comprenden terminología clínica nativa y razonan mejor sobre tareas sanitarias que los modelos generalistas. No son apps para el clínico: son el componente de IA que está llegando integrado en el software hospitalario. En 2026, el 85% de las organizaciones de salud implementan o evalúan activamente IA generativa, con ahorros documentados de entre 45 minutos y más de dos horas por médico al día en documentación clínica. [1]

Los modelos más relevantes son MedGemma, Med-PaLM, Meditron y el ecosistema open source formado por OpenBioLLM, Med42 y BioMistral. Ninguno está aprobado para uso clínico directo sin supervisión, y todos presentan aún limitaciones en razonamiento bajo incertidumbre. [4][8]

Puntos clave

Familia open source basada en Gemma 3, con variante multimodal 4B (texto e imagen médica) y 27B solo texto. Diseñada para triaje, análisis radiológico y razonamiento clínico. [3][4]

Modelos cerrados con rendimiento experto en USMLE y benchmark MultiMedQA. No disponibles para uso público directo. [5] 

Primer LLM médico especialista completamente abierto, con énfasis en auditabilidad y transparencia del entrenamiento. [6] 

Extracción de información clínica, triaje y documentación ambiental con ahorros de 45 min a 2 h por médico al día. [1][7]

Alucinaciones residuales, sesgo anglosajón y dificultades en razonamiento bajo incertidumbre. Supervisión humana siempre necesaria. [2][8] 

Los modelos de lenguaje específicos para medicina son LLMs que aprenden de datos clínicos, no de internet en general. La diferencia con ChatGPT o Gemini no es de grado: es de origen. Un modelo médico se reentrena con PubMed, guías de práctica clínica, libros de texto y casos de exámenes médicos. El resultado es un sistema que maneja terminología clínica nativa y comete menos errores en tareas sanitarias específicas.

Para el profesional sanitario, esto significa que la IA que llegará a su hospital no será la misma que usa desde el móvil. Llegará integrada en el HCE, en el asistente de documentación o en el sistema de triaje, sin que el clínico la vea ni la elija directamente.

Por qué la medicina necesitaba sus propios modelos de IA 

En 2026, el 85% de las organizaciones de salud implementan o evalúan activamente IA generativa, frente al 72% de inicios de 2024. [1] Las aplicaciones más consolidadas son la documentación clínica ambiental, el análisis de imágenes y la automatización de procesos administrativos.

Los ahorros documentados en documentación clínica alcanzan entre 45 minutos y más de dos horas por médico al día. [1]

Un modelo generalista entiende de medicina porque ha leído mucho sobre ella. Pero no razona nativamente en términos clínicos. Cuando se equivoca en una nota clínica, el coste es muy distinto a equivocarse en un correo.

MedGemma: la apuesta multimodal de Google 

MedGemma es el lanzamiento open source más relevante del año en LLMs médicos. Presentado en Google I/O 2025, está basado en la arquitectura Gemma 3. [3]

Llega en dos configuraciones: MedGemma 4B, multimodal, procesa texto e imágenes médicas (radiografías, dermatología, oftalmología, histopatología); y MedGemma 27B, centrado en texto y razonamiento clínico avanzado.

MedGemma no está aprobado para uso clínico directo. Google lo posiciona como base para que desarrolladores e investigadores construyan aplicaciones sanitarias, con acceso vía Hugging Face o Vertex AI. [4]

Med-PaLM y Med-Gemini: rendimiento experto en cerrado

Med-PaLM 2 y Med-Gemini son los modelos cerrados de Google que han marcado el listón técnico del sector. Alcanzan rendimiento a nivel experto en el USMLE y en el benchmark MultiMedQA, con puntuaciones superiores al 90% en algunas pruebas. [5]

No están disponibles para uso público directo. Su relevancia radica en haber demostrado que un modelo puede razonar a nivel clínico experto, empujando al resto del sector hacia la especialización.

Meditron: la apuesta europea por un modelo abierto y auditable

Meditron es la principal apuesta europea por un modelo médico abierto, desarrollado por la Escuela Politécnica Federal de Lausana (EPFL). Su última iteración, Apertus-MeditronFO, es el primer modelo médico especialista completamente abierto y auditable. [6]

La mayoría de modelos llamados “abiertos” solo liberan los pesos, no los datos ni los procedimientos de entrenamiento. Para un hospital europeo que deba cumplir el Reglamento Europeo de IA, la transparencia del entrenamiento no es un extra: es un requisito. [6]

OpenBioLLM, Med42 y BioMistral: el ecosistema open source

OpenBioLLM, Med42 y BioMistral adaptan modelos generalistas como LLaMA 3 o Mistral con corpus biomédicos. Son la opción habitual para hospitales que necesitan desplegar IA médica de forma local, sin enviar datos a servidores externos, respetando los requisitos de privacidad del entorno sanitario europeo. [6]

Qué cambia en la práctica clínica

En el shared task MEDIQA-OE 2025, MedGemma fue evaluado para extraer órdenes médicas de conversaciones reales entre profesional sanitario y paciente. Reducir la carga documental y mejorar la seguridad del paciente son dos de las aplicaciones con mayor valor demostrado. [7]

Otras aplicaciones incluyen el triaje y priorización de pacientes, la comprensión de informes radiológicos en variantes multimodales y la respuesta a preguntas clínicas con vocabulario médico nativo. [1][2]

En España, 127 proyectos activos de IA en hospitales del SNS posicionan al país como quinto en Europa. Muchos, hasta ahora apoyados en modelos generalistas, están integrando LLMs médicos en sus pipelines.

Por qué el HCP no puede todavía sustituir ChatGPT por uno de estos modelos 

Los modelos médicos especializados son una buena noticia para la industria sanitaria. Pero no son productos de consumo: el acceso requiere conocimientos técnicos vía Hugging Face, Vertex AI o despliegue local. [3][4]

Están diseñados como componente dentro de software clínico, no como interfaz directa para el usuario final. El HCP probablemente usará estos modelos sin saberlo, cuando el módulo de IA de su HCE genere resúmenes o cuando el sistema de triaje incorpore razonamiento clínico nativo.

Sus desarrolladores son explícitos: estos modelos no están aprobados para uso clínico directo sin supervisión. [4]

Las limitaciones que conviene tener presentes

Un análisis de abril de 2026 advierte que los LLMs médicos aún presentan limitaciones importantes en el razonamiento clínico. La gestión de la incertidumbre y la generación de diagnósticos diferenciales siguen siendo sus puntos débiles. [8]

Superar el USMLE con un 90% no equivale a fiabilidad en un paciente real, donde la información es incompleta y ambigua. [2] A esto se suman las alucinaciones residuales y el sesgo del entrenamiento dominado por literatura anglosajona.

Estos sistemas deben apoyar al profesional sanitario, no sustituirlo. La verificación humana sigue siendo obligatoria. [2][8]

Conclusión 

Los modelos de lenguaje específicos para medicina representan el paso de herramientas generalistas adaptadas con esfuerzo a sistemas diseñados desde el origen para el contexto clínico.

MedGemma, Med-PaLM, Meditron y el ecosistema open source están construyendo la base de la próxima generación de software clínico inteligente. El profesional sanitario no necesita cambiar mañana de herramienta.

Saber qué son, qué pueden y qué no pueden hacer estos modelos es parte de la nueva alfabetización digital del HCP. Campus IA seguirá acercando estas innovaciones al profesional sanitario de forma segura y efectiva.

Entender qué son los LLMs médicos, qué pueden y qué no pueden hacer, es ya parte de la formación digital del HCP.

Los recursos y funcionalidades mencionados en este sitio web no han sido desarrollados, financiados, promovidos ni validados por Sanofi. Sanofi los recopila y describe en Campus IA con fines puramente ilustrativos, y no se responsabiliza de la exactitud o integridad de la información resultante de su uso ni de las opiniones expresadas sobre los mismos. Es responsabilidad del profesional sanitario asegurar el uso adecuado y la supervisión de los resultados obtenidos a través de la inteligencia artificial, así como verificar la veracidad de la información y la interpretación de las opiniones de los expertos. La inteligencia artificial no debe sustituir el juicio humano del profesional sanitario, sino complementar el ejercicio de su profesión.

Descubre los avances
más recientes en IA
aplicada a la medicina
Referencias
  1. NetMD. “Inteligencia Artificial Generativa en el Hospital: ¿Herramienta de Apoyo o Decisor Clínico?”. NetMD, 2026. https://netmd.org/inteligencia-articular-hospital/
  2. Computers, Materials & Continua (CMC). “Transforming Healthcare with State-of-the-Art Medical-LLMs”. Vol. 86, Nº 2, diciembre 2025. https://www.techscience.com/cmc/v86n2/64752/html
  3. UNFPA Blog. “Google presenta MedGemma: un nuevo modelo multimodal de IA para aplicaciones médicas”. UNFPA, 2025. https://www.unfpa.org.pe/google-presenta-medgemma-un-nuevo-modelo-multimodal-de-ia-para-aplicaciones-medicas/
  4. Asociación Salud Digital. “MedGemma, dos nuevos modelos de IA generativa”. Salud-digital.es, 2025. https://salud-digital.es/2025/06/16/medgemma-dos-nuevos-modelos-de-ia-generativa/
  5. Pal A, Sankarasubbu M. “Gemini Goes to Med School”. Proceedings of the 6th Clinical NLP Workshop, 2024. https://arxiv.org/pdf/2402.07023
  6. arXiv. “Fully Open Meditron: An Auditable Pipeline for Clinical LLMs”. Preprint, 2025. https://arxiv.org/html/2605.16215
  7. Balachandran A et al. “EXL Health AI Lab at MEDIQA-OE 2025: Evaluating Prompting Strategies with MedGemma”. MEDIQA-OE Shared Task, 2025. https://arxiv.org/pdf/2511.10583
  8. Science Media Centre España. “Los modelos de IA siguen sin ser seguros para el diagnóstico médico sin supervisión”. SMC España, 2026. https://sciencemediacentre.es/los-modelos-de-ia-siguen-sin-ser-seguros-para-el-diagnostico-medico-sin-supervision 

MAT-ES-2602378 V1 Julio 2026