Por una vez, no hay noticias que digan que la inteligencia artificial vuelve a superar a los humanos en algo. En la práctica diaria, los radiólogos todavía parecen ser mejores para reconocer enfermedades pulmonares comunes que los sistemas de inteligencia artificial. Esto se desprende de una comparación entre cuatro herramientas de inteligencia artificial y un grupo de 72 médicos en los que se evaluaron más de 2.000 radiografías de los pulmones para detectar afecciones agudas comunes.
Los sistemas de IA disponibles comercialmente eran bastante buenos en su trabajo, pero tenían más probabilidades de diagnosticar una afección cuando no estaba presente (un falso positivo) que los radiólogos. También obtuvieron peores resultados que los médicos cuando se presentaron varias enfermedades al mismo tiempo o cuando las desviaciones eran sólo menores.
Este los investigadores escriben afiliado a dos hospitales daneses y a la Universidad de Copenhague el martes en la revista científica Radiología. La IA todavía no debe verse como algo más que una herramienta de apoyo y se debe tener cuidado, especialmente en casos complejos, concluyen.
Aprendizaje profundo
Reconocer desviaciones en los patrones es una tarea en la que la inteligencia artificial (IA) es muy buena. Gracias a aprendizaje profundo quienes aplican dichos algoritmos pueden procesar información en múltiples capas, cada vez más abstractas. Además, a diferencia de los médicos, es fácil entrenar los algoritmos con millones de fotografías de muestra, los algoritmos funcionan muy rápido y nunca se cansan.
Este estudio analizó qué tan bien la IA puede reconocer una serie de enfermedades pulmonares comunes: enfermedades respiratorias (como neumonía o edema pulmonar), neumotórax (colapso pulmonar) y derrame pleural (acumulación de líquido alrededor de los pulmones).
Se revisaron 2.040 fotografías de pulmón, de pacientes entre 58 y 81 años. En 669 casos hubo una enfermedad pulmonar aguda, en 1.371 casos no la hubo. Las fotografías no eran aisladas, había fotografías anteriores de 1.641 pacientes, más de la mitad de los pacientes tenían problemas pulmonares múltiples, incluso no agudos. Los radiólogos podrían incluir esta información en su evaluación tal como en su práctica diaria, pero los sistemas de IA no pudieron hacerlo.
Diagnósticos perdidos
Las diferencias más sorprendentes se observaron en la identificación de enfermedades respiratorias. Las herramientas de IA informaron incorrectamente un resultado positivo entre el 13,7 y el 36,9 por ciento de los casos, mientras que para los radiólogos esto fue del 11,6 por ciento de los casos. La proporción de diagnósticos fallidos (falsos negativos) fue en promedio de alrededor del 20 por ciento tanto para las herramientas de inteligencia artificial como para los radiólogos, y estos generalmente involucraban anomalías sutiles.
Al identificar el líquido alrededor de los pulmones, las tasas de falsos positivos fueron mucho más bajas (AI 1,1 a 2,4 por ciento, radiólogos 0,2 por ciento). Un pulmón colapsado se evaluó como falso positivo y falso negativo con la misma frecuencia.
“Al igual que investigaciones anteriores, este estudio también muestra que los médicos no deben sobreestimar los resultados de la IA”, escriben dos radiólogos de la Universidad de Osaka en Japón en un comentario en Radiología. Pero se espera que las herramientas de IA sigan mejorando. “Una razón importante por la que los médicos obtienen mejores resultados es el acceso a más datos que esa única fotografía. La IA también puede evolucionar en esta dirección. Además, están surgiendo otros tipos de algoritmos que aprenden de forma ligeramente diferente y los primeros resultados son prometedores”.
Los japoneses también consideran una pena que el estudio no desglose los resultados de los radiólogos en función de los años de experiencia. “Para descubrir qué impacto puede tener la IA en el desempeño de los médicos en el entorno clínico real, esta es información esencial”.