Adobe a construit une partie de sa stratégie en intelligence artificielle (IA) sur un principe fondamental : la protection des créateurs dans un monde en pleine évolution. Alors que d’autres grandes entreprises technologiques sont critiquées pour la provenance incertaine de leurs données, Adobe se positionne comme une alternative responsable. Cependant, cette réputation est mise à l’épreuve par une demande en justice qui met en lumière l’entraînement d’un de ses modèles et l’utilisation d’œuvres protégées par le droit d’auteur.
Détails de la demande de la plaignante
La plainte, déposée mardi devant le tribunal fédéral du district nord de Californie, se présente comme une action collective. Elizabeth Lyon, une auteur, accuse Adobe d’avoir utilisé des livres protégés, y compris ses propres œuvres, pour entraîner des modèles d’IA, notamment SlimLM, sans obtenir les autorisations nécessaires. Selon les documents judiciaires, ces œuvres ont été intégrées dans le processus d’entraînement des systèmes d’IA conçus pour interagir avec les utilisateurs via des instructions.
Origens des données utilisées
La question centrale de ce litige repose sur le type de données utilisées pour former les modèles. En effet, la plainte souligne que le problème ne réside pas seulement dans SlimLM, le produit final, mais plutôt dans les données utilisées au cours de l’entraînement. Adobe a expliqué que SlimLM a été pré-entraîné avec SlimPajama-627B, un jeu de données open source publié par Cerebras en juin 2023. D’après les documents judiciaires, SlimPajama est dérivé d’un autre jeu de données, RedPajama, qui intègre Books3, une collection massive de livres protégés.
L’impact de SlimLM et le débat plus large
Il est essentiel de comprendre que SlimLM est un modèle de langage conçu pour des tâches spécifiques, notamment l’assistance sur des appareils mobiles, et pas uniquement pour des créations artistiques de grande ampleur. Cette distinction est cruciale car le débat sur l’utilisation des données d’entraînement dépasse les applications les plus visibles de l’IA.
Une dynamique légale en évolution
Ce cas s’inscrit dans un cadre plus large de litiges aux États-Unis concernant l’utilisation non autorisée d’œuvres protégées pour l’entraînement des modèles d’IA. Récemment, d’autres créateurs ont également intenté des poursuites contre des entreprises telles qu’OpenAI et Anthropic pour des allégations similaires. Certains de ces cas ont abouti à des règlements financiers importants, ce qui rend chaque nouvelle plainte importante pour la définition légale de l’utilisation des données en IA.
Que nous réserve l’avenir ?
Actuellement, cette affaire est en phase préliminaire, laissant plusieurs questions en suspens. La plaignante demande une compensation financière non spécifiée et représente d’autres créateurs potentiellement affectés. Adobe, quant à elle, n’a pas souhaité commenter l’affaire. Le processus judiciaire déterminera si cette demande progresse, est rejetée ou aboutit à un règlement. Au-delà du résultat immédiat, le cas soulève des enjeux cruciaux quant à l’équilibre entre l’évolution de l’IA et les droits des créateurs de contenus.
Images | Rubaitul Azad | Adobe

