L’IA générative devrait payer les artistes humains pour leur formation


Un appartement au-dessus d’un magasin de poulet frit à Notting Hill est un endroit étrange pour être au cœur de ce qui a été appelé « l’une des questions juridiques les plus importantes » du 21e siècle. C’est le siège social de Stability AI, un groupe d’intelligence artificielle qui bouleverse les artistes du monde entier.

Stability AI est dirigé par Emad Mostaque, un informaticien et ancien employé de fonds spéculatifs. Il exploite le logiciel de génération d’images Stable Diffusion, décrit dans un Procès américain comme « un outil de collage du 21e siècle qui remixe les œuvres protégées par le droit d’auteur de millions de personnes ». Tapez « Elon Musk dans une peinture de Van Gogh » et il produit un pastiche amusant.

Les trois femmes artistes derrière les États-Unis procès avoir du soutien. Getty Images, le groupe de photos avec 135 millions d’images protégées par le droit d’auteur sur sa base de données, a entamé la semaine dernière une autre action en justice contre Stability AI devant les tribunaux britanniques. Les images de Getty, ainsi que des millions d’autres, sont utilisées pour former Stable Diffusion afin qu’il puisse exécuter ses tours.

La révolution de l’IA générative a éclaté rapidement : Stable Diffusion n’est sorti qu’en août et promet de « permettre à des milliards de personnes de créer de l’art époustouflant en quelques secondes ». Microsoft a investi plusieurs milliards de dollars dans OpenAI, qui a dévoilé l’année dernière le générateur de texte en image Dall-E et exécute ChatGPT.

L’art visuel n’est pas la seule discipline dans laquelle les agents de l’IA menacent de faire des ravages. L’industrie de la musique tremble à l’idée que des millions de chansons (et des milliards de propriété intellectuelle) soient analysées par l’IA pour produire de nouveaux morceaux. Tencent Music, le groupe de divertissement chinois, a sorti plus de 1 000 titres avec des voix synthétiques.

En théorie, l’art algorithmique n’est pas plus en mesure d’échapper au droit d’auteur et aux autres lois sur la propriété intellectuelle que les humains : si un outil d’IA produit une chanson ou une image qui ne transforme pas suffisamment les œuvres sur lesquelles il s’appuie pour être originales, les artistes qui ont été exploités peut porter plainte. Utiliser une boîte noire pour déguiser ce qui a été surnommé « blanchiment de musique » n’est pas une stratégie juridique convaincante.

Un agent d’intelligence artificielle qui apprend à partir d’une base de données n’est pas non plus totalement différent de ce que les humains ont toujours fait. Ils écoutent des chansons de groupes rivaux et étudient d’autres artistes pour apprendre de leurs techniques. Bien que les tribunaux soient pleins de litiges pour savoir si les auteurs-compositeurs ont copié illégalement, personne ne leur dit de se boucher les oreilles, ou avertit les peintres de fermer les yeux lors d’expositions.

Mais l’échelle fait toute la différence, comme le sait très bien l’industrie musicale. C’était assez sûr à l’ère pré-numérique, lorsque la musique était vendue sur vinyle et CD et parfois copiée sur cassettes par les fans. Lorsque Napster a permis le téléchargement et la distribution en masse de pistes numériques, l’industrie a été confrontée à de graves problèmes avant d’être sauvée par Spotify et le streaming sous licence.

Les outils d’intelligence artificielle non seulement analysent les bases de données, mais fabriquent des images sur commande : pourquoi s’arrêter à Van Gogh alors que vous pouvez obtenir Musk de Monet, Gauguin ou Warhol simplement en tapant des invites ? Ce n’est pas du grand art mais Estelle Derclaye, professeur de droit de la propriété intellectuelle à l’université de Nottingham, observe que « si l’IA commence à remplacer la créativité humaine, nous avons un problème ».

Les humains conservent de nombreux avantages: une version synthétique de Harry Styles appelée par un autre nom ne serait pas une fraction aussi populaire qu’un interprète, même si le propriétaire de l’outil d’IA s’en sortait. Mais il existe d’autres utilisations – la musique de fond dans les jeux vidéo, par exemple – pour lesquelles un groupe synthétique sonnant comme BTS pourrait suffire.

Essayer d’arrêter l’art de l’IA serait impossible, ainsi que indésirable. Mais le cadre juridique doit être défini pour éviter que la créativité humaine ne soit submergée financièrement. Le problème soulevé par Getty est de savoir si des entreprises telles que Stability AI devraient être en mesure de former leurs outils d’IA sur de grandes quantités de matériel protégé par le droit d’auteur sans demander la permission ni payer de frais de licence.

Ceci est légal pour la recherche dans de nombreux pays, et le gouvernement britannique a proposé l’étendre à un usage commercial. Aux États-Unis, des appels similaires ont été lancés pour que les modèles d’IA obtiennent le droit à un « apprentissage équitable » sur ces données, car il serait impossible de retrouver tous les détenteurs de licence de gigaoctets de données récupérées sur le Web, d’obtenir leur approbation et de les récompenser.

Cela me semble trop blasé, et semblable aux arguments de l’époque du téléchargement illégal que le cheval numérique avait boulonnés, et tout le monde devait s’y habituer. Stability AI a été évalué à 1 milliard de dollars et l’investissement de Microsoft dans OpenAI montre qu’il y a de l’argent autour ; ce qu’il faut, c’est un mécanisme pour répartir davantage entre les créateurs.

Les individus ont besoin de protections supplémentaires : c’est une chose de former un logiciel d’IA sur une masse de matériel, mais que se passe-t-il si quelqu’un se nourrit des œuvres d’un seul artiste vivant et demande ensuite un nouveau croquis dans son style ? Un illustrateur de Los Angeles était soumis à un tel « réglage fin » de l’IA par un utilisateur de Stable Diffusion récemment ; il n’est pas clair si un tribunal appellerait cela un usage loyal, mais je ne le fais pas.

« Sachez que nous prenons ces questions au sérieux », a promis Stability AI la semaine dernière. Sa déclaration a-t-elle été rédigée par un humain ou par un outil d’IA ? De nos jours, c’est si difficile à dire.

[email protected]



ttn-fr-56