{"id":1102086,"date":"2023-12-21T17:24:16","date_gmt":"2023-12-21T17:24:16","guid":{"rendered":"https:\/\/teknomers.com\/es\/el-conjunto-de-datos-utilizado-para-el-entrenamiento-de-ia-contiene-pornografia-infantil\/"},"modified":"2023-12-21T17:24:21","modified_gmt":"2023-12-21T17:24:21","slug":"el-conjunto-de-datos-utilizado-para-el-entrenamiento-de-ia-contiene-pornografia-infantil","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/el-conjunto-de-datos-utilizado-para-el-entrenamiento-de-ia-contiene-pornografia-infantil\/","title":{"rendered":"El conjunto de datos utilizado para el entrenamiento de IA contiene pornograf\u00eda infantil"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Una investigaci\u00f3n realizada por el Observatorio de Internet de Stanford (SIO), presentada el 20 de diciembre, puso de relieve la presencia de varios cientos de im\u00e1genes que resaltan el abuso sexual de menores en un conjunto de datos.  Muchas empresas utilizan este \u00faltimo para entrenar modelos de inteligencia artificial (IA) generativa.<\/p>\n<h2>\u00bfVarias versiones de Stable Diffusion entrenadas con datos impactantes?<\/h2>\n<p>Conocido como LAION-5B, este vasto conjunto de datos se aprovech\u00f3 para el desarrollo del modelo de aprendizaje autom\u00e1tico de Difusi\u00f3n Estable, utilizado por m\u00e1s de diez millones de usuarios en noviembre.  Con m\u00e1s de cinco mil millones de im\u00e1genes, pies de foto y textos de todo tipo procedentes de Internet, tendr\u00eda al menos 1.008 ilustraciones que contienen actos de abuso sexual contra ni\u00f1os.<\/p>\n<p>Para llevar a cabo su investigaci\u00f3n, la SIO utiliz\u00f3 herramientas de hash como PhotoDNA desarrollada por Microsoft.  Estas soluciones permiten asociar la huella dactilar de una imagen a partir de bases de datos generadas por organizaciones que reciben y procesan denuncias relacionadas con abusos sexuales a menores en l\u00ednea.<\/p>\n<p>Al descubrir este contenido, los investigadores del SIO alertaron inmediatamente al Centro Internacional para Ni\u00f1os Desaparecidos y Explotados Sexualmente, con sede en Estados Unidos, as\u00ed como al Centro Canadiense para la Protecci\u00f3n Infantil.  Actualmente las dos organizaciones est\u00e1n llevando a cabo los tr\u00e1mites necesarios para lograr la eliminaci\u00f3n de estas impactantes im\u00e1genes en LAION-5B.  Como afirma la SIO en una publicaci\u00f3n de blog, \u201c <em>Los modelos podr\u00e1n generar im\u00e1genes impactantes debido a algunos de los datos subyacentes sobre los que se construyeron.  El informe recomienda que los modelos basados \u200b\u200ben Stable Diffusion 1.5 queden obsoletos y que la distribuci\u00f3n cese siempre que sea posible.<\/em> &#8220;.<\/p>\n<p>La start-up brit\u00e1nica Stable AI, que financi\u00f3 y populariz\u00f3 Stable Diffusion, quiso se\u00f1alar que la versi\u00f3n 1.5 de su inteligencia artificial hab\u00eda sido publicada por Runway, otra entidad que hab\u00eda contribuido al desarrollo del modelo original.  Desde entonces, supuestamente se ha creado una versi\u00f3n m\u00e1s reciente del software, la 2.0. <em>utilizando conjuntos de datos que han sido filtrados de contenido ofensivo y peligroso<\/em> &#8220;.<\/p>\n<p>Un portavoz de la nueva empresa dijo que la empresa se comprometer\u00eda &#8221; <em>para prevenir el uso indebido de la IA y proh\u00edbe el uso de sus modelos de im\u00e1genes para actividades ilegales, incluidos los intentos de modificar o crear contenido que represente abuso sexual de menores.<\/em> &#8220;.  Se han introducido varias funciones de etiquetado de contenido para identificar las im\u00e1genes generadas en la plataforma y as\u00ed identificar un posible uso indebido de la IA por parte de personas malintencionadas.<\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/siecledigital.fr\/2023\/12\/21\/un-ensemble-de-donnees-utilise-pour-la-formation-dia-contient-des-contenus-pedopornograhiques\/\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-4<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Una investigaci\u00f3n realizada por el Observatorio de Internet de Stanford (SIO), presentada el 20 de diciembre, puso de<\/p>\n","protected":false},"author":1,"featured_media":1102087,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[222074,220086,222073,9147,16466,1755,8040,7093,18,39177,932],"class_list":["post-1102086","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-aprendizaje-automatico","tag-aprendizaje-profundo","tag-bases-de-datos","tag-conjunto","tag-contiene","tag-datos","tag-entrenamiento","tag-infantil","tag-para","tag-pornografia","tag-utilizado"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1102086","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=1102086"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1102086\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/1102087"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=1102086"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=1102086"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=1102086"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}