Un « calculateur de mort » IA pourrait-il réellement être une bonne chose ?


Restez informé avec des mises à jour gratuites

L’écrivain est un commentateur scientifique

Nos vies, comme les histoires, suivent des arcs narratifs. Chacun se déroule de manière unique en chapitres aux titres familiers : école, carrière, déménagement, blessure, maladie. Chaque histoire, ou vie, a un début, un milieu et une fin imprévisible.

Or, selon les scientifiques, chaque histoire de vie est la chronique d’une mort annoncée. En utilisant les données du registre danois, qui contient une multitude d’informations quotidiennes sur l’éducation, le salaire, l’emploi, les heures de travail, le logement et les visites chez le médecin, les universitaires ont développé un algorithme capable de prédire le parcours de vie d’une personne, y compris son décès prématuré. de la même manière que les grands modèles linguistiques (LLM) tels que ChatGPT peuvent prédire les phrases. L’algorithme a surpassé les autres modèles prédictifs, notamment les tables actuarielles utilisées par le secteur des assurances.

Que nos existences complexes puissent être analysées comme des fragments de texte est à la fois exaltant et déconcertant. Même si nous savons qu’un revenu généreux est corrélé à une espérance de vie plus longue, le fait de relier de grandes quantités de données différentes pourrait révéler d’autres façons dont les facteurs sociaux affectent la santé. Cela pourrait éclairer les décideurs politiques cherchant à améliorer nos chances de vivre plus longtemps et en meilleure santé.

Du côté négatif, il y a quelque chose de presque absurdement réducteur dans l’idée d’un DeathGPT. Chaque perle du collier de la vie – assister à un cours, augmenter son salaire, perdre un parent – ​​semble trop personnelle pour alimenter un ensemble de données prévisibles. Mais, à l’ère du Big Data et de l’IA pour les exploiter, nous devrons accepter que ces expériences qualitatives profondément ressenties peuvent être capturées quantitativement de manière à dessiner, à l’intérieur de barres d’erreur, le destin individuel.

Sune Lehmann, de l’Université technique du Danemark, qui a dirigé la recherche publiée le mois dernier dans Nature Computational Science, ne trouve pas l’idée déconcertante. «Je pense que la similitude entre les textes et les vies est profonde et multiforme», m’a-t-il dit par e-mail. « Il me semble logique que notre algorithme puisse prédire la prochaine étape dans la vie humaine. »

Le langage et la vie sont des séquences. Les chercheurs, issus de l’Université de Copenhague et de la Northeastern University de Boston, ont exploité cette similitude. Premièrement, ils ont compilé un « vocabulaire » des événements de la vie, créant une sorte de langage synthétique, et l’ont utilisé pour construire des « phrases ». Un exemple de phrase pourrait être : « Au cours de sa troisième année à l’internat secondaire, Hermione a suivi cinq cours au choix. »

Tout comme les LLM extraient le texte pour comprendre les relations entre les mots, l’algorithme life2vec, alimenté par les histoires de vie reconstituées des 6 millions d’habitants du Danemark entre 2008 et 2015, a exploité ces résumés pour trouver des relations similaires.

Puis est venu le moment du bilan : dans quelle mesure pourrait-il appliquer cette formation approfondie pour faire des prédictions de 2016 à 2020 ? Parmi les tests d’algorithmes, les chercheurs ont étudié un échantillon de 100 000 personnes âgées de 35 à 65 ans, dont la moitié ont survécu et l’autre moitié est décédée au cours de cette période. Lorsqu’on lui a demandé de deviner lesquels sont morts, life2vec a réussi 79 pour cent du temps (une estimation aléatoire donne un taux de réussite de 50 pour cent). Il a surpassé de 11 % les autres meilleurs modèles prédictifs, a déclaré Lehmann.

Alors que l’article affirme que « des prédictions individuelles précises sont effectivement possibles », l’algorithme fournit une probabilité de décès sur une certaine période plutôt qu’une date exacte. Il y a des mises en garde : ce qui s’applique au Danemark pourrait ne pas s’appliquer ailleurs, et l’algorithme code des biais dans les données de formation. Néanmoins, compte tenu de son potentiel à affiner la prévision des risques, son impact sur le secteur de l’assurance méritera d’être surveillé. De leur côté, les chercheurs ne souhaitent pas que leurs travaux soient utilisés par les assureurs et gardent pour l’instant l’algorithme et les données secrets.

Mais ce qui est plus intéressant que les résultats, soulignent les chercheurs, c’est que life2vec est général plutôt que spécifique à une tâche. Dans les modèles prédictifs existants, les chercheurs doivent prédéfinir les variables importantes, telles que l’âge, le sexe et le revenu. En revanche, cette approche avale toutes les données et peut s’appuyer indépendamment sur des facteurs pertinents (elle a constaté que le revenu compte positivement pour la survie, par exemple, et qu’un diagnostic de santé mentale compte négativement). Cela pourrait orienter les chercheurs vers des influences jusqu’alors inexplorées sur la santé et découvrir de nouveaux liens entre des modèles de comportement apparemment sans rapport.

L’une des préoccupations croissantes de Lehmann est la vie privée ; il souligne que des sociétés telles que Google assemblent des machines de prédiction musclées, en utilisant une abondance de données personnelles collectées sur Internet.

Nous vivons une ère de prévisibilité sans précédent dans la vie humaine – et une ère de pouvoir sans précédent pour ceux qui peuvent lire nos histoires avant que nous les ayons vécues.



ttn-fr-56