Los sitios de noticias holandeses también están tomando medidas contra el almacenamiento de datos OpenAI


Exterior de la sede de MediahuisImagen de la aplicación

Editorial Mediahuis de, entre otros. NRC, El Telégrafo y el belga El estandar tomó la iniciativa. En el código de los sitios de noticias de NRC y El Telégrafo se encuentra declarado explícitamente que los bots de OpenAI, entre otros, no pueden recolectar artículos.

A esto le siguen los sitios de noticias. el ejemplo de por ejemplo Los New York Times, CNN, ReutersEl Washington Post y (reciente) El guardián. El hecho de que empresas como OpenAI o Google estén pescando en gran parte de la web sin permiso para entrenar sus modelos lingüísticos es motivo de irritación para las empresas de medios desde hace algún tiempo. El Correo de Washington quedó claro en abril de este año ¿Qué tipo de sitios están involucrados? con uno de esos conjuntos de datos (llamado Google C4).

El Amsterdam verde Luego realizó una investigación similar para datos holandeses específicos. Los artículos de los medios holandeses también se utilizan ampliamente en la formación de los modelos lingüísticos. ‘Esos son normales todos nuestros artículos?’, respondió en ese momento el editor jefe de Volkskrant, Pieter Klok. El verde.

Detener

Gracias en parte a todos esos artículos de noticias (pero también a los libros electrónicos, por ejemplo), los chatbots populares como ChatGPT son, en muchos casos, capaces de proporcionar respuestas impresionantes a las preguntas formuladas. Aunque esos artículos originales no aparecen uno a uno en los textos que escupen Bard (de Google) o ChatGPT, su existencia hubiera sido imposible sin el esfuerzo de escritores y periodistas.

DPG Media también cree que es hora de actuar. El editor belga de, entre otros de Volkskrant, AD y Nu.nl decidió unirse esta semana creciente número de sitios de noticias qué robots de IA pondrán fin. En las próximas semanas, todos los sitios de DPG recibirán algunas líneas de código adicionales.

Un portavoz dice que está «contento» de que OpenAI ahora prometa tener en cuenta los deseos de los propietarios de sitios web. «Pero es una lástima que tengas que indicar por separado para cada robot de inteligencia artificial que no les das permiso para copiar tu sitio web para sus propios fines (a menudo comerciales)».

Paño para sangrar

La prohibición de la IA sólo se aplica para uso futuro: ‘ChatGPT ya ha recopilado, copiado, almacenado y utilizado todos los artículos y fotografías que hemos publicado en línea sin permiso para entrenar su propia IA. Desvergonzado por tu propio beneficio. El hecho de que ahora prometan no hacerlo de ahora en adelante se siente como un paño contra la hemorragia”. DPG Media declaró anteriormente en sus términos de uso que no otorga permiso para el rastreo de datos, pero las empresas de inteligencia artificial no cumplieron.

También Nu.nl obtiene el fragmento de código, pero ese mismo sitio Sorprendentemente, también utiliza los servicios de OpenAI. El sitio de noticias ha estado publicando desde la semana pasada. resúmenes que acompañan a algunos de sus artículos. Estos se crean usando ChatGPT.

Se trata de un servicio comercial de OpenAI, mediante el cual la empresa no utilizará los textos recién introducidos para seguir entrenando sus modelos. Pero se retuerce, admite el portavoz cuando se le pregunta. Nu.nl después de todo, paga por un servicio de una empresa que nunca ha pagado un centavo a los editores, sin los cuales ese servicio no podría haber existido.

Mediahuis también está experimentando explícitamente con la IA: el editor lanzó recientemente un sitio de deportes en el que, entre otras cosas, ChatGPT ocupa los titulares. Como muchos otros medios de Volkskrant La IA, en cambio, como herramienta, nunca como producto final.



ttn-es-23