{"id":1293069,"date":"2024-07-27T00:34:09","date_gmt":"2024-07-27T00:34:09","guid":{"rendered":"https:\/\/teknomers.com\/es\/la-start-up-de-inteligencia-artificial-anthropic-acusada-de-un-robo-de-datos-atroz\/"},"modified":"2024-07-27T00:34:15","modified_gmt":"2024-07-27T00:34:15","slug":"la-start-up-de-inteligencia-artificial-anthropic-acusada-de-un-robo-de-datos-atroz","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/la-start-up-de-inteligencia-artificial-anthropic-acusada-de-un-robo-de-datos-atroz\/","title":{"rendered":"La start-up de inteligencia artificial Anthropic acusada de un robo de datos &#8220;atroz&#8221;"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Desbloquea el Editor&#8217;s Digest gratis<\/p>\n<p class=\"article__content-sign-up-topic-description\"><span>Roula Khalaf, editora del FT, selecciona sus historias favoritas en este bolet\u00edn semanal.<\/span><\/p>\n<p><iframe class=\"article__content-sign-up-iframe close\" scrolling=\"no\" id=\"signUpIframe\" data-prev-url=\"\/register\/in-article-sign-up?ft-content-uuid=07611b74-3d69-4579-9089-f2fc2af61baa\"><\/iframe><\/div>\n<div id=\"article-body\">\n<p>La empresa emergente de inteligencia artificial Anthropic ha sido acusada de extraer datos de sitios web de forma agresiva para entrenar sus sistemas, violando potencialmente los t\u00e9rminos de servicio de los editores en el proceso, seg\u00fan los afectados. <\/p>\n<p>Los desarrolladores de IA dependen de la ingesta de grandes cantidades de datos extra\u00eddos de una amplia variedad de fuentes para crear grandes modelos de lenguaje, la tecnolog\u00eda detr\u00e1s de chatbots como ChatGPT de OpenAI y el rival de Anthropic, Claude. <\/p>\n<p>Anthropic fue fundada por un grupo de ex investigadores de OpenAI con la promesa de desarrollar sistemas de IA \u201cresponsables\u201d. <\/p>\n<p>Sin embargo, Matt Barrie, director ejecutivo de Freelancer.com, acus\u00f3 a la compa\u00f1\u00eda con sede en San Francisco de ser \u201ccon diferencia el raspador m\u00e1s agresivo\u201d de su portal para freelancers, que tiene millones de visitas diarias. <\/p>\n<p>Otros editores web se han hecho eco de las preocupaciones de Barrie de que Anthropic est\u00e1 invadiendo sus sitios e ignorando sus instrucciones de dejar de recopilar su contenido para entrenar sus modelos. <\/p>\n<p>Seg\u00fan los datos compartidos con el Financial Times, Freelancer.com recibi\u00f3 3,5 millones de visitas de un &#8220;rastreador&#8221; web vinculado a Anthropic en el espacio de cuatro horas. Eso hace que Anthropic tenga &#8220;probablemente unas cinco veces el volumen del segundo&#8221; rastreador de inteligencia artificial, dijo Barrie. <\/p>\n<blockquote class=\"n-content-pullquote n-content-pullquote--no-image\" aria-hidden=\"true\">\n<div class=\"n-content-pullquote__content\">\n<p>Los motores de b\u00fasqueda siempre han realizado mucho scraping, pero han subido un nivel con el entrenamiento de la IA generativa.<\/p>\n<\/div>\n<\/blockquote>\n<p>Las visitas de su bot continuaron aumentando incluso despu\u00e9s de que Freelancer.com intentara rechazar sus solicitudes de acceso, utilizando protocolos web est\u00e1ndar para guiar a los rastreadores, agreg\u00f3. Despu\u00e9s de eso, Barrie decidi\u00f3 bloquear por completo el tr\u00e1fico de las direcciones de Internet de Anthropic. <\/p>\n<p>\u201cTuvimos que bloquearlos porque no obedecen las reglas de Internet\u201d, dijo Barrie. \u201cEsto es un robo de datos atroz\u201d. [which] \u201cHace que el sitio sea m\u00e1s lento para todos los que operan en \u00e9l y, en \u00faltima instancia, afecta nuestros ingresos\u201d.<\/p>\n<p>Anthropic dijo que estaba investigando el caso y que respetaba las solicitudes de los editores y su objetivo era no ser &#8220;intrusivo ni disruptivo&#8221;. <\/p>\n<p>La extracci\u00f3n de datos disponibles p\u00fablicamente de toda la web suele ser legal, pero la pr\u00e1ctica es pol\u00e9mica, puede infringir los t\u00e9rminos de servicio de los sitios web y puede resultar costosa para los proveedores de alojamiento de los mismos. <\/p>\n<p>Kyle Wiens, director ejecutivo de iFixit.com, dijo que su sitio de reparaciones electr\u00f3nicas recibi\u00f3 un mill\u00f3n de visitas de bots antr\u00f3picos en el espacio de 24 horas. \u201cTenemos un mont\u00f3n de alarmas [for high traffic]\u201cLa gente se despierta a las 3 de la ma\u00f1ana y eso hace sonar todas las alarmas que tenemos\u201d, dijo. <\/p>\n<p>Seg\u00fan Wiens, las condiciones de servicio de iFixit prohib\u00edan el uso de sus datos para el aprendizaje autom\u00e1tico. \u201cMi primer mensaje a Anthropic es: si est\u00e1n usando esto para entrenar su modelo, eso es ilegal. El segundo es: esto no es un comportamiento educado en Internet. El rastreo es una cuesti\u00f3n de etiqueta\u201d.<\/p>\n<p>Los sitios web utilizan un protocolo conocido como &#8220;robots.txt&#8221; para intentar mantener a los rastreadores y otros robots web fuera de ciertas partes de sus sitios. Sin embargo, depende del cumplimiento voluntario. <\/p>\n<p>\u201cRespetamos el archivo robots.txt y nuestro rastreador respet\u00f3 esa se\u00f1al cuando iFixit lo implement\u00f3\u201d, afirm\u00f3 Anthropic. La empresa tambi\u00e9n afirm\u00f3 que sus rastreadores respetaban las \u201ctecnolog\u00edas antielusi\u00f3n\u201d como los CAPTCHA, y que \u201cnuestro rastreo no deber\u00eda ser intrusivo ni disruptivo. Nuestro objetivo es causar la m\u00ednima interrupci\u00f3n siendo cuidadosos con la velocidad con la que rastreamos los mismos dominios\u201d.<\/p>\n<p>La extracci\u00f3n de datos no es una pr\u00e1ctica nueva, pero ha aumentado dr\u00e1sticamente en los \u00faltimos dos a\u00f1os como resultado de la carrera armamentista de la inteligencia artificial, lo que ha impuesto nuevos costos a los sitios web. <\/p>\n<p>\u201cLos rastreadores de IA nos han costado una cantidad significativa de dinero en cargos por ancho de banda y nos han hecho dedicar una gran cantidad de tiempo a lidiar con el abuso\u201d, escribi\u00f3 Eric Holscher, cofundador del sitio web de alojamiento de documentos Read the Docs en un<a rel=\"nofollow noopener\" href=\"https:\/\/about.readthedocs.com\/blog\/2024\/07\/ai-crawlers-abuse\/\" data-trackable=\"link\" target=\"_blank\"> entrada en el blog<\/a> el jueves. \u201cLos rastreadores de IA est\u00e1n actuando de una manera que no es respetuosa con los sitios que rastrean, y eso provocar\u00e1 una reacci\u00f3n negativa contra los rastreadores de IA en general\u201d, agreg\u00f3. <\/p>\n<p>Anthropic ha creado algunos de los chatbots m\u00e1s avanzados del mundo (que rivalizan con ChatGPT de OpenAI) que pueden responder a una variedad de indicaciones en lenguaje natural, al tiempo que se posicionan como un actor m\u00e1s \u00e9tico que algunos rivales. El prop\u00f3sito declarado de Anthropic es &#8220;el desarrollo y mantenimiento responsable de la IA avanzada para el beneficio a largo plazo de la humanidad&#8221;. <\/p>\n<p>A medida que las principales empresas de IA compiten para crear modelos cada vez m\u00e1s capaces y h\u00e1biles, se adentran cada vez m\u00e1s en rincones inexplorados de la web, asoci\u00e1ndose con editores o creando datos de entrenamiento sint\u00e9ticos. <\/p>\n<p>En los \u00faltimos meses, OpenAI ha cerrado varios acuerdos con editores y proveedores de contenido, entre ellos Reddit, The Atlantic y The Financial Times. Anthropic no ha anunciado p\u00fablicamente alianzas similares. <\/p>\n<p>\u201cLos motores de b\u00fasqueda siempre han realizado un gran trabajo de scraping\u201d, dijo Barrie, \u201cpero han subido un nivel con el entrenamiento de la IA generativa\u201d.<\/p>\n<p>La misi\u00f3n de iFixit \u201ces dar informaci\u00f3n\u201d, dijo Wiens, para alentar a la gente a reparar sus propios dispositivos. \u201cNo nos oponemos a que utilicen nuestro contenido para entrenar modelos, solo queremos ser parte de la conversaci\u00f3n\u201d.<\/p>\n<p>Agreg\u00f3: \u201cNo soy un cruzado en este tema, solo estoy tratando de mantener un sitio web en l\u00ednea\u201d. <\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/www.ft.com\/content\/07611b74-3d69-4579-9089-f2fc2af61baa\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-56<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Desbloquea el Editor&#8217;s Digest gratis Roula Khalaf, editora del FT, selecciona sus historias favoritas en este bolet\u00edn semanal.<\/p>\n","protected":false},"author":1,"featured_media":1293070,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[14120,144104,118,19076,1755,117,6586,11791],"class_list":["post-1293069","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-acusada","tag-anthropic","tag-artificial","tag-atroz","tag-datos","tag-inteligencia","tag-robo","tag-startup"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1293069","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=1293069"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1293069\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/1293070"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=1293069"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=1293069"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=1293069"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}