Parfois, je rêve d’un appel téléphonique. « Les mûres se portent bien, papa. Et votre vieux vélo a été volé récemment. Avez-vous des nouvelles? »
« Oh non. Ça va bien ici.
« Bien, à bientôt ! »
Même si je sais qu’il est parti, j’ai supposé un instant que mon père écoutait à l’autre bout du fil.
Rêver n’est plus nécessaire – nous avons l’intelligence artificielle. Il fait revivre les voix du passé. Le dernier tour de force dans ce domaine est une interview en podcast fictive avec feu Steve Jobs. Le co-fondateur d’Apple est décédé en 2011, mais il y avait suffisamment d’enregistrements audio pour former un algorithme pour fabriquer une voix synthétique.
Vous pouvez faire dire n’importe quoi à l’ordinateur avec le timbre de Jobs. « Il » ressemble à Steve Jobs s’adressant à une salle remplie d’audience, car la voix est basée sur des enregistrements de ses présentations Apple.
La voix clonée de l’intervieweur, l’animateur de talk-show Joe Rogan, semble plus crédible. Il y avait des centaines d’heures de podcasts de Rogan disponibles pour les algorithmes à mâcher. Et plus il y a de données, meilleur est le résultat final.
La conversation entre Jobs et Rogan est également maquillée par l’intelligence artificielle. La conversation est raide : surtout les rires entre les deux sonnent mal à l’aise.
Ce n’est qu’une question de temps avant que de telles irrégularités disparaissent, dit Jarno Duursma. C’est un expert technologique néerlandais qui étudie l’intelligence artificielle. La fascination de Duursma : les deepfakes, des versions manipulées de la réalité. Il a construit une version numérique de lui-même, avec une voix simulée.
Batman mange un hamburger
C’est l’ère de texte à tout, dit Duursma. Vous pouvez créer des textes crédibles basés sur quelques mots clés – une astuce du modèle de langage GPT-3. La dernière tendance en intelligence artificielle est la génération d’images basée sur une description textuelle.
C’est une activité addictive, tel un créateur d’images : tout ce à quoi vous pouvez penser est visible en deux clics. Presque inimaginable.
Par exemple, vous tapez « Batman mangeant un hamburger à Munich » ou « Un bébé avec un vieux visage dans une voiture sur la lune » et le générateur d’images crée une image unique, en quatre variantes. Les résultats sont étonnamment réels. Certaines images ont quelque chose d’absurde. Visages déformés ou personnes avec un membre de trop ; quelque part entre Halloween et une hallucination. Mais la technologie progresse – plus de puissance de calcul, plus de données – et devient plus réaliste.
De nombreuses images ressemblent à des dessins animés ou à des peintures. De cette façon, vous pouvez facilement créer vous-même de l’« art » dans le style de Monet, Van Gogh, Picasso ou Warhol. L’art devient plus accessible avec des outils aussi puissants. Tout le monde pouvait déjà peindre avec Ravensburger, maintenant tout le monde peut voir son fantasme représenté par un algorithme. Les vrais artistes se grattent la tête.
Ratissé ensemble
Il existe plusieurs projets où vous pouvez essayer cette technologie. Elles sont appelées Dall-E2, Diffusion stable et Mi-parcours et sont depuis peu accessibles à tous.
La technique fonctionne quelque chose comme ça : vous pouvez entraîner des algorithmes pour supprimer le bruit d’une image. Si vous inversez ce processus, vous pouvez apprendre à l’ordinateur à partir du bruit à créer une toute nouvelle image étape par étape, par exemple en utilisant les termes Batman et hamburger. Les réseaux sont formés sur bases de données avec des milliards (par des personnes) d’images étiquetées, ratissées ensemble sur Internet. Vous pouvez y ajouter vos propres images.
Microsoft, l’un des investisseurs de Dall-E, ajoute le créateur d’images à son logiciel de conception afin que vous puissiez « créer des cartes postales et des invitations uniques ».
C’est la version amicale.
Les générateurs d’images ne demandent qu’à être abusés. Pour propager de faux événements, mettre des mots dans la bouche des politiciens. Pour extorquer ou arnaquer les gens, à travers l’écran.
Google a intégré des filtres pour vous empêcher de créer des images ou des vidéos à caractère violent ou pornographique. Mais tous les abus ne peuvent pas être évités. À ma demande, Dall-E2 a généré une image qui ressemblait à une manifestation se déroulant au Palais de la Paix à La Haye. Faux. Grâce à Stable Diffusion, j’ai fait s’embrasser profondément Vladimir Poutine et Xi Jinping – également faux.
Il est facile de tromper le consommateur moyen de médias lorsque la technologie évolue si rapidement, pense Jarno Duursma. « De nombreuses images ressemblent encore à un dessin ou à une peinture. Mais dans un an, vous serez capable de créer des images photo-réalistes avec quelques mots de texte. Il n’y a qu’une chose à faire : confiance zéro. Ne faites pas confiance à tout ce que vous voyez à l’écran.
Avec la première application de deepfakes, en 2018, des algorithmes ont collé les visages des stars de cinéma sur les corps des stars du porno. Quatre ans plus tard, la barre pour imiter quelqu’un est beaucoup plus basse. Amazon dit que vous pouvez reproduire la voix de quelqu’un sur la base d’une minute de matériel audio. C’est comme ça que grand-mère peut toujours continuez à lire des histoires via le haut-parleur intelligent d’Amazon.
Les vidéos ne nécessitent pas non plus beaucoup de données : vous pouvez donner vie à une vieille photo via un algorithme appelé Deep Nostalgia. Cela produit un image animée comme dans un journal Harry Potter. Duursma : « J’ai essayé avec une photo de ma mère, décédée il y a trois ans. Sa photo a bougé, mais j’ai pensé : ma mère ne ressemble décidément pas à ça. C’est un substitut.
Un nouveau marché pour les contrefaçons est en train d’émerger. Celle du processus de deuil. Vous pouvez toujours utiliser l’intelligence artificielle parler aux morts, c’est l’idée. Magazine filaire a qualifié ce phénomène d’exemple de « notre relation changeante avec la mort, pas nécessairement » sinistre”.
La question est de savoir si vous voulez continuer à vivre comme ça après votre mort, comme une pièce de musée numérique. Jarno Duursma ne s’y intéresse pas : « Je me suis fait un avatar et un voixcloner. Donc si je meurs cet après-midi, mes enfants et ma femme pourront continuer à faire des vidéos de moi indéfiniment. Mais j’espère qu’ils ne le feront pas. »
Perdre fait partie de la vie, dit Duursma. Et si vous voulez en être sûr, vous devrez inscrire dans votre testament si les proches ne sont pas autorisés à réutiliser votre voix et votre image. Considérez-le comme une extension du courant registre des donneurs: utiliser mes organes, mais supprimer mes données. Rêver est autorisé.