¿Podría una ‘calculadora de muerte’ de IA ser realmente algo bueno?


Manténgase informado con actualizaciones gratuitas

El escritor es un comentarista científico.

Nuestras vidas, como las historias, siguen arcos narrativos. Cada uno se desarrolla de forma única en capítulos con títulos familiares: escuela, carrera, mudanza, lesión, enfermedad. Cada historia, o vida, tiene un comienzo, un desarrollo y un final impredecible.

Ahora, según los científicos, cada historia de vida es la crónica de una muerte anunciada. Utilizando los datos del registro de Dinamarca, que contienen una gran cantidad de información diaria sobre educación, salario, trabajo, horas de trabajo, vivienda y visitas al médico, los académicos han desarrollado un algoritmo que puede predecir el curso de vida de una persona, incluida la muerte prematura, en De la misma manera que los modelos de lenguaje grandes (LLM) como ChatGPT pueden predecir oraciones. El algoritmo superó a otros modelos predictivos, incluidas las tablas actuariales utilizadas por la industria de seguros.

Que nuestras complejas existencias puedan analizarse como fragmentos de texto es a la vez estimulante y desconcertante. Si bien sabemos que un ingreso generoso se correlaciona con una esperanza de vida más larga, vincular grandes cantidades de datos diferentes podría desenmascarar otras formas en que los factores sociales afectan la salud. Eso podría informar a los formuladores de políticas que buscan mejorar nuestras probabilidades de vivir vidas más largas y saludables.

En el lado negativo, hay algo casi absurdamente reduccionista en la idea de un DeathGPT. Cada cuenta del collar de la vida (asistir a una clase, un aumento de salario, perder a un padre) parece demasiado personal para alimentar un conjunto de datos predecible. Pero, en una era de big data y de inteligencia artificial para extraerlos, tendremos que aceptar que esas experiencias cualitativas profundamente sentidas pueden capturarse cuantitativamente de manera que, dentro de las barras de error, esbocen el destino individual.

Sune Lehmann, de la Universidad Técnica de Dinamarca, que dirigió la investigación publicada el mes pasado en Nature Computational Science, no encuentra la idea desconcertante. “Creo que la similitud entre el texto y la vida es profunda y multifacética”, me dijo por correo electrónico. “Para mí tiene sentido que nuestro algoritmo pueda predecir el siguiente paso en la vida humana”.

Tanto el lenguaje como la vida son secuencias. Los investigadores, provenientes de la Universidad de Copenhague y la Universidad Northeastern de Boston, explotaron esa similitud. Primero, compilaron un “vocabulario” de acontecimientos de la vida, creando una especie de lenguaje sintético, y lo utilizaron para construir “oraciones”. Una frase de ejemplo podría ser: “Durante su tercer año en el internado de secundaria, Hermione siguió cinco clases optativas”.

Así como los LLM extraen textos para descubrir las relaciones entre palabras, el algoritmo life2vec, alimentado con las historias de vida reconstituidas de los 6 millones de habitantes de Dinamarca entre 2008 y 2015, extrajo estos resúmenes en busca de relaciones similares.

Luego llegó el momento de ajustar cuentas: ¿qué tan bien podría aplicar esa extensa capacitación para hacer predicciones de 2016 a 2020? Entre las pruebas de algoritmo, los investigadores estudiaron una muestra de 100.000 personas de entre 35 y 65 años, de las cuales se sabe que la mitad sobrevivió y la otra mitad murió durante ese período. Cuando se le pidió que adivinara cuáles murieron, life2vec acertó el 79 por ciento de las veces (las adivinanzas aleatorias dan una tasa de acierto del 50 por ciento). Superó a los siguientes mejores modelos predictivos, dijo Lehmann, en un 11 por ciento.

Si bien el artículo afirma que “es cierto que es posible realizar predicciones individuales precisas”, el algoritmo proporciona una probabilidad de muerte durante un período determinado en lugar de una fecha exacta. Hay advertencias: lo que se aplica en Dinamarca puede no aplicarse en otros lugares, y el algoritmo codifica sesgos en los datos de entrenamiento. Aun así, dado su potencial para afinar la predicción de riesgos, valdrá la pena observar el impacto en la industria de seguros. Por su parte, los investigadores no quieren que las aseguradoras utilicen su trabajo y mantienen el algoritmo y los datos en secreto por ahora.

Pero lo más interesante que los resultados, subrayan los investigadores, es que life2vec es general y no específico para una tarea. En los modelos predictivos existentes, los investigadores deben preespecificar variables importantes, como la edad, el sexo y los ingresos. Por el contrario, este enfoque se traga todos los datos y puede centrarse de forma independiente en factores relevantes (identificó que los ingresos cuentan positivamente para la supervivencia, por ejemplo, y que un diagnóstico de salud mental cuenta negativamente). Esto podría señalar a los investigadores influencias sobre la salud nunca antes exploradas y descubrir nuevos vínculos entre patrones de comportamiento aparentemente no relacionados.

Una de las crecientes preocupaciones de Lehmann es la privacidad; Señala que empresas como Google están montando poderosas máquinas de predicción, utilizando una gran cantidad de datos personales extraídos de Internet.

Esta es una era de previsibilidad incomparable en las vidas humanas, y una era de poder incomparable para quienes pueden leer nuestras historias antes de que las hayamos vivido.



ttn-es-56