sanitarios intervienen a un paciente en un centro hospitalario

EP

logo
Así acelerará la Inteligencia Artificial el diagnóstico del coronavirus

Inteligencia artificial & Ciencia

Así acelerará la Inteligencia Artificial el diagnóstico del coronavirus

El Hospital Clínic y el BSC utilizarán los datos de 2.440 pacientes de Covid-19 de la primera ola para desarrollar una tecnología que ayude a predecir la evolución de los nuevos ingresados

¿Puede una máquina ayudar a predecir si un paciente con Covid-19 necesitará UCI o morirá por la enfermedad? En eso trabajan el Hospital Clínic y el Barcelona Supercomputing Center (BSC). Gracias a la inteligencia artificial, los investigadores quieren conocer cómo evolucionará cada infectado que ingrese en el hospital catalán. La tecnología, aún en desarrollo, ayudará al Clínic a planificar su respuesta ante nuevas oleadas de contagios.

El proyecto tiene dos patas. Por un lado, extraer y estructurar datos de los informes clínicos sobre los casos de Covid-19. Y después, utilizar esos datos para entrenar a un sistema de inteligencia artificial que ayude al Clínic a diagnosticar a los pacientes. El proyecto forma parte del Plan de Impulso a las Tecnologías del Lenguaje de la Secretaría de Estado de Digitalización e Inteligencia Artificial (Sedia) Y no sólo participará el centro catalán. También ha despertado el interés del Hospital Virgen del Rocío de Sevilla y entra en los planes del 12 de octubre de Madrid.

Marta Villegas es co-directora de la unidad de minería de textos del BSC. Trabaja en una de las partes más complejas del proyecto: extraer la información relevante de los documentos médicos. Hablamos de informes de laboratorio, de radiología, diagnósticos o cursos clínicos. «Ahí los sanitarios se expresan con lenguaje natural, en castellano. Anotan sus observaciones y la evolución del paciente. Y estos datos, como no están estructurados, se pierden», explica. Simplificando la técnica, la minería de textos sería como convertir un Word en un Excel. «Si tienes un Excel con un montón de pacientes, puedes ordenarlos. Sin embargo, si tienes un montón de Words pues los vas subrayando, no puedes hacer gran cosa».

El BSC extraerá los datos de los informes clínicos de 3.051 episodios de Covid-19, que corresponden a 2.440 pacientes que ingresaron en el Clínic en la primera ola de la pandemia. Con técnicas de aprendizaje profundo, otra rama de la inteligencia artificial, los investigadores reconocerán patrones dentro de los textos médicos. Así se podrá recopilar datos relevantes sobre los resultados de los diagnósticos, sobre los síntomas del infectado, cuáles fueron sus tratamientos o sobre su evolución. Con estos nuevos datos, y con los que el Clínic ya tenga estructurados inicialmente, se entrenará al sistema de predicción.

Comenzará así la segunda pata del proyecto. ¿Cómo termina una máquina prediciendo (y acertando) cómo evolucionará un contagiado? Para entenderlo, hay que detenerse en dos conceptos: el aprendizaje automático y el aprendizaje profundo. En el aprendizaje automático, los algoritmos recopilan la mayor cantidad posible de información y la utilizan para hacer predicciones basadas en datos. Aprenden de forma automática, sin necesidad de haber sido programados. El aprendizaje profundo es una rama del aprendizaje automático. Pero va un paso más allá. Se trata de un conjunto de algoritmos que aprende a partir de la experiencia. Cuantos más datos tenga la máquina, mejor capacidad de predicción.

¿Y cómo se entrenará al sistema del Clínic? De los 3.051 episodios de Covid-19, por ejemplo, el sistema sólo entrenaría con un 80% de ellos. Se realizarán todas las pruebas posibles hasta que logren el mejor modelo de predicción. Después tendrán que evaluar su precisión. Para ello utilizarán el 20% de los episodios de pacientes que se habían guardado. Hay que recordar que los investigadores conocen si estos pacientes al final se curaron, fueron casos más o menos graves, o murieron. Entonces utilizarán el sistema para analizar ese 20% de episodios y conocerán la probabilidad de acierto del modelo. A partir de ahí, la precisión del sistema crecerá a medida que entrene con más datos de nuevos pacientes del Clínic.

No es un proceso sencillo. Para entrenar a un modelo basado en redes neuronales se necesita una gran capacidad de cálculo. Algo que está al alcance de superordenadores como el MareNostrum 4, del BSC. Sólo así el sistema podrá diferenciar entre lo que es importante y lo que es superfluo. Por ahora, los investigadores quieren un modelo que responda a tres situaciones: «Sí el paciente va a morir o no, si va a ingresar en UCI o sí va a requerir asistencia respiratoria», detalla Villegas. Una información que ayudará a tratar a los pacientes y que servirá al Hospital para planificar su respuesta ante nuevos repuntes de la pandemia.

Comentar ()