{"id":1650974,"date":"2025-04-02T14:58:03","date_gmt":"2025-04-02T14:58:03","guid":{"rendered":"https:\/\/teknomers.com\/es\/con-su-hambre-de-datos-las-companias-de-ia-estan-poniendo-en-wikipedia\/"},"modified":"2025-04-02T14:58:08","modified_gmt":"2025-04-02T14:58:08","slug":"con-su-hambre-de-datos-las-companias-de-ia-estan-poniendo-en-wikipedia","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/con-su-hambre-de-datos-las-companias-de-ia-estan-poniendo-en-wikipedia\/","title":{"rendered":"Con su hambre de datos, las compa\u00f1\u00edas de IA est\u00e1n poniendo en Wikipedia"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Las empresas que desarrollan inteligencia artificial pone en peligro a Wikipedia. La Fundaci\u00f3n Wikimedia, la empresa matriz de la popular enciclopedia en l\u00ednea en un <a rel=\"nofollow noopener\" href=\"https:\/\/diff.wikimedia.org\/2025\/04\/01\/how-crawlers-impact-the-operations-of-the-wikimedia-projects\/?ref=platformer.news\" target=\"_blank\">Blog Publicado el martes<\/a>.<\/p>\n<p>El problema proviene de la popularidad de r\u00e1pido crecimiento de Wikipedia y el sitio hermano Wikimedia Commons, donde se pueden encontrar imagen, sonido y video. Pero no es en primer lugar haber visitado visiblemente los sitios web de Wikimedia desde el a\u00f1o pasado y, por lo tanto, cargar en gran medida la infraestructura. Son bots.<\/p>\n<p>Los desarrolladores de IA utilizan estos programas inform\u00e1ticos para pastar autom\u00e1ticamente Internet y recopilar tantos datos como sea posible para capacitar a sus modelos de lenguaje grandes (LLM) llamados. Esos modelos de lenguaje forman la base de sistemas como ChatGPT de Open-AI, que puede producir texto en respuesta a preguntas, y m\u00e1s y m\u00e1s im\u00e1genes y sonido.<\/p>\n<p>Las enormes colecciones de Wikipedia y Wikimedia Commons reunidos por voluntarios contienen una gran cantidad de informaci\u00f3n confiable y pueden usarse de forma gratuita para todos. Eso los convierte en una fuente atractiva para sus sistemas para las empresas de IA. <\/p>\n<h2 class=\"gn4-crosshead article-heading\">Otra din\u00e1mica<\/h2>\n<p>El contenido de Wikimedia, escribe los tres autores en su blog, siempre fue una parte importante de los resultados que las personas se mostraron en los motores de b\u00fasqueda. &#8220;A su vez, llevaron a los usuarios a regresar a nuestros sitios web. Pero con el surgimiento de la inteligencia artificial (IA), la din\u00e1mica est\u00e1 cambiando&#8221;. <\/p>\n<p>Los sistemas autom\u00e1ticos de las compa\u00f1\u00edas de IA inundan los sitios web de Wikimedia, pero los chatbots a menudo no mencionan d\u00f3nde obtuvieron su informaci\u00f3n, e incluso si lo hacen, la Wikimedia produce relativamente pocos visitantes. La gran visita a gran escala de los bots a los sitios web es una gran carga para la infraestructura: el tr\u00e1fico de los bots ocupa mucho &#8216;ancho de banda&#8217;, por lo que los retrasos ocurren para todos, tambi\u00e9n para los usuarios humanos.<\/p>\n<blockquote class=\"dmt-quote\" data-styled=\"None\">\n<p>Nuestro contenido es gratuito, pero nuestra infraestructura no es<\/p>\n<footer class=\"dmt-quote__attribution\">\n<span class=\"dmt-quote__attribution-source\">Wikimedia <\/span><br \/>\n<\/footer>\n<\/blockquote>\n<p>&#8220;Nuestra infraestructura est\u00e1 construida para poder absorber un aumento repentino de los visitantes humanos en eventos especiales&#8221;, dice Wikimedia. &#8220;Pero la cantidad de tr\u00e1fico que obtenemos a trav\u00e9s de los bots que raspan Internet no tiene precedentes y implica grandes riesgos y costos&#8221;.<\/p>\n<p>Los riesgos porque los t\u00e9cnicos de Wikimedia tienen sus manos llenas de acomodar la gran visita a gran escala de bots, que llegan a satisfacer su hambre de datos. Como resultado, los t\u00e9cnicos tienen menos tiempo para hacer que la visita humana adicional a los sitios web funcione sin problemas en caso de eventos importantes inesperados. <\/p>\n<p>Los costos adicionales surgen a trav\u00e9s de la necesidad de utilizar m\u00e1s personal t\u00e9cnico y, adem\u00e1s, hacer que m\u00e1s ancho de banda est\u00e9 disponible. &#8220;Reconocemos que todo Internet usa nuestro contenido, pero debe suceder de una manera que pueda sostenerse para nosotros&#8221;, dijo Wikimedia. &#8220;Nuestro contenido es gratuito, pero nuestra infraestructura no lo es&#8221;. La Fundaci\u00f3n Wikimedia est\u00e1 casi completamente financiada por donaciones.<\/p>\n<h2 class=\"gn4-crosshead article-heading\">Servidor cerca<\/h2>\n<p>Wikimedia utiliza centros de datos en todo el mundo para poder servir a sus usuarios r\u00e1pidamente. Por ejemplo, si un usuario o grupo de usuarios a menudo solicita un art\u00edculo sobre Wikipedia, el contenido se almacena en un servidor cercano a esos usuarios, para que pueda entregarse r\u00e1pidamente. Los art\u00edculos que rara vez se solicitan permanecen en un servidor central. Si todav\u00eda se solicitan, la solicitud primero debe &#8216;viajar&#8217; hasta ese centro de datos, y luego el art\u00edculo vuelve al usuario, que cuesta m\u00e1s tiempo y dinero.<\/p>\n<p>Los usuarios humanos a menudo solicitan los mismos art\u00edculos, por ejemplo, porque los temas est\u00e1n en las noticias. Pero los bots de las compa\u00f1\u00edas de IA est\u00e1n interesados \u200b\u200ben todo el contenido, incluidas las p\u00e1ginas menos populares, para las cuales a menudo tienen que ser llevadas a los servidores centrales, &#8220;lo que lo hace m\u00e1s costoso para nosotros&#8221;, dijo Wikimedia. Por ejemplo, los botes de AI se sofocan Wikipedia &#8220;, escribe la columnista de tecnolog\u00eda Casey Newton en su bolet\u00edn <em>Juego de plataformas<\/em>.<\/p>\n<p><dmt-icon class=\"dmt-article-suggestion__icon\" name=\"ic-forward\"\/><\/p>\n<div class=\"dmt-article-suggestion__text\">\n<p>\t\t\t\tLeer tambi\u00e9n\n\t\t\t<\/p>\n<p><span>La base detr\u00e1s de la wikipedia idealista tom\u00f3 una salida comercial<\/span>\n<\/div>\n<p>Al igual que para las compa\u00f1\u00edas de noticias, Wikipedia tambi\u00e9n juega el problema de que las compa\u00f1\u00edas de IA se est\u00e1n desarrollando r\u00e1pidamente en fuentes competitivas de informaci\u00f3n. A medida que el uso de chatbots para recopilar informaci\u00f3n se establece a\u00fan m\u00e1s, el h\u00e1bito de consultar sitios web de noticias y Wikipedia se est\u00e1 volviendo gradualmente en desuso. &#8220;A la larga, el riesgo de que los bots de IA aseguren que una visita a sitios web como Wikipedia ya no sea necesaria&#8221;, escribe Newton, &#8220;y que Wikipedia ya no puede continuar&#8221;. Con el que los bots se secaron la fuente que tambi\u00e9n beben ellos mismos.<\/p>\n<p><dmt-util-bar article=\"4888584\" data-paywall-belowarticle=\"\" headline=\"Met hun honger naar data brengen AI-bedrijven Wikipedia in het nauw\" url=\"https:\/\/www.nrc.nl\/nieuws\/2025\/04\/02\/met-hun-honger-naar-data-brengen-ai-bedrijven-wikipedia-in-het-nauw-a4888584\"><br \/>\n<button class=\"dmt-util-bar__button\" slot=\"share\"><br \/>\n<span class=\"dmt-util-bar__button-container\"><br \/>\n<span class=\"dmt-util-bar__button-title\">Para compartir<\/span><br \/>\n<dmt-icon aria-hidden=\"true\" class=\"dmt-util-bar__button-icon\" name=\"ic-share-web\"\/><br \/>\n<\/span><br \/>\n<\/button><br \/>\n<button class=\"dmt-util-bar__button\" slot=\"contact\"><br \/>\n<span class=\"dmt-util-bar__button-container\"><br \/>\n<span class=\"dmt-util-bar__button-title\">Env\u00ede por correo a los editores<\/span><br \/>\n<dmt-icon aria-hidden=\"true\" class=\"dmt-util-bar__button-icon\" name=\"ic-email\"\/><br \/>\n<\/span><br \/>\n<\/button><br \/>\n<\/dmt-util-bar> <\/p>\n<aside data-article-id=\"4888584\" data-js-topic-preview=\"\" data-topic-id=\"65\" data-topic-name=\"Kunstmatige intelligentie\"\/>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/www.nrc.nl\/nieuws\/2025\/04\/02\/met-hun-honger-naar-data-brengen-ai-bedrijven-wikipedia-in-het-nauw-a4888584\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-33<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Las empresas que desarrollan inteligencia artificial pone en peligro a Wikipedia. La Fundaci\u00f3n Wikimedia, la empresa matriz de<\/p>\n","protected":false},"author":1,"featured_media":1650975,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[7179,99,1755,415,10106,246,9047,49897],"class_list":["post-1650974","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-companias","tag-con","tag-datos","tag-estan","tag-hambre","tag-las","tag-poniendo","tag-wikipedia"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1650974","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=1650974"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1650974\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/1650975"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=1650974"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=1650974"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=1650974"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}