Les groupes de médias cherchent un nouveau modèle de profit avec l’IA


Débloquez gratuitement l’Editor’s Digest

En ce qui concerne l’essor de l’IA générative, de nombreux acteurs du secteur des médias semblent avoir tiré les leçons de leur douloureuse expérience avec les gardiens en ligne tels que Google et Facebook.

Cette fois, ils agissent plus tôt pour garder le contrôle de leur contenu. Mais compte tenu de l’attrait des chatbots comme ChatGPT, ont-ils plus de chances de conserver leur public et leurs revenus en ligne qu’auparavant ?

Une série de transactions récentes – et de poursuites judiciaires – montre qu’ils agissent au moins tôt. Cette semaine, Perplexity, une start-up de moteur de recherche qui utilise l’IA générative pour produire des résultats améliorés, annoncé accords de partage des revenus avec un groupe éclectique d’éditeurs, dont Automattic (propriétaire de WordPress.com), Der Spiegel et Time.

Ceci a suivi accusations L’entreprise a en effet récupéré clandestinement des informations sur des sites de médias pour les alimenter dans son service de recherche. Cette pratique n’est pas illégale, mais elle constitue une violation de l’étiquette en ligne qui régit la manière dont les informations sur les sites Web destinés au public doivent être utilisées.

OpenAI a également conclu une série d’accords avec des sociétés de médias, notamment avec le Financial Times. Mais avec son partenaire Microsoft, elle est également confrontée au plus grand défi juridique des éditeurs de presse, sous la forme d’une plainte pour violation de droits d’auteur déposée par le New York Times.

À bien des égards, les défis économiques et les questions juridiques soulevés par l’IA générative sont familiers depuis les débuts d’Internet. De nombreux éditeurs se plaignent depuis longtemps que des services comme Google News volent leur audience – tout en s’appuyant fortement sur eux pour générer du trafic. Les tribunaux ont donné leur feu vert aux moteurs de recherche, et les bénéfices financiers directs que les entreprises de médias ont pu en tirer sont venus du système politique, des pays comme l’Australie et le Canada ayant adopté des lois pour forcer les plus grandes entreprises Internet à payer.

Dans une certaine mesure, après une période de confusion générale qui a apparemment conduit à l’absorption d’une grande partie du contenu d’actualité pour former de grands modèles linguistiques, un certain ordre a été rétabli. OpenAI, par exemple, a dit Le géant du web se conformera aux demandes des éditeurs de ne pas explorer leurs sites Web. À la fin de l’année dernière, la plupart des grands éditeurs bloquaient déjà les robots d’exploration IA, selon le Reuters Institute for the Study of Journalism.

Pour autant, se retirer purement et simplement de la prochaine grande révolution technologique ne semble pas être une stratégie durable pour les entreprises de médias. L’accord conclu entre Perplexity et les éditeurs revient à admettre que les entreprises d’IA pourraient avoir du mal à se défendre contre les revendications de droits d’auteur.

Pour l’instant, le débat reste essentiellement théorique. ChatGPT a stupéfié le monde de la technologie, mais il n’a pas encore démontré que les chatbots pouvaient rivaliser avec d’autres plateformes d’information grand public. La « productisation » des LLM en est encore à ses balbutiements. La forme que prendront ces nouveaux services et le fonctionnement des modèles économiques qui les entourent restent encore à déterminer. Cela offre une importante opportunité au secteur des médias.

Perplexity, par exemple, a accepté de reverser aux éditeurs une partie des revenus publicitaires liés directement aux résultats qui dépendent de leur contenu. Cette mesure ne permettra pas de payer les salaires de nombreux journalistes à court terme : Perplexity n’a même pas encore inventé les nouveaux formats publicitaires. Et comme de nombreuses start-ups de moteurs de recherche qui l’ont précédée, elle doit se battre pour s’imposer sur un marché dominé par Google. Mais pour les éditeurs, elle établit au moins un modèle économique qu’ils pourront promouvoir plus largement.

La question clé est de savoir quel est leur pouvoir de négociation. Comme Internet avant lui, l’IA révèle le caractère de marchandise d’une grande partie du contenu en ligne. Il sera également difficile d’extraire une valeur, voire aucune, de l’utilisation de leur matériel dans la formation générale des LLM. Selon OpenAI, l’ensemble du secteur de l’information ne représente qu’une « petite partie » des données sur lesquelles ces modèles sont formés. La menace tacite qui pèse sur les éditeurs est la suivante : si vous ne respectez pas nos conditions, nous serons heureux de vous exclure.

D’un autre côté, une fois formés, les LLM sont statiques et les informations qu’ils produisent peuvent rapidement paraître obsolètes. Des techniques combinant des données récentes et pertinentes avec les résultats des LLM pour produire des résultats sur mesure pourraient combler cette lacune. Pour cela, l’accès à des sources d’information actualisées devient vital.

Le fonctionnement de ces services n’est pas encore clair. Produiront-ils uniquement des extraits comme le fait Google News ? Dans quelle mesure mettront-ils en évidence les sources sur lesquelles ils s’appuient et quel trafic redirigeront-ils vers les sites Web des éditeurs ? Et, surtout, quels revenus supplémentaires produiront-ils et comment seront-ils partagés ? Pour les éditeurs, essayer de façonner le résultat en fonction de questions comme celles-ci semble valoir la peine.

[email protected]

Cette histoire a été modifiée pour refléter le fait qu’Automattic est le propriétaire de WordPress.com, et non de Medium comme indiqué dans une version antérieure



ttn-fr-56