{"id":708308,"date":"2023-04-14T08:13:50","date_gmt":"2023-04-14T08:13:50","guid":{"rendered":"https:\/\/teknomers.com\/es\/el-equipo-rojo-de-openai-los-expertos-contratados-para-romper-chatgpt\/"},"modified":"2023-04-14T08:13:53","modified_gmt":"2023-04-14T08:13:53","slug":"el-equipo-rojo-de-openai-los-expertos-contratados-para-romper-chatgpt","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/el-equipo-rojo-de-openai-los-expertos-contratados-para-romper-chatgpt\/","title":{"rendered":"El equipo rojo de OpenAI: los expertos contratados para &#8216;romper&#8217; ChatGPT"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div data-attribute=\"article-content-body\">\n<p>Despu\u00e9s de que Andrew White obtuviera acceso a GPT-4, el nuevo sistema de inteligencia artificial que impulsa el popular chatbot ChatGPT, lo us\u00f3 para sugerir un agente nervioso completamente nuevo.<\/p>\n<p>El profesor de ingenier\u00eda qu\u00edmica de la Universidad de Rochester estuvo entre los 50 acad\u00e9micos y expertos contratados para probar el sistema el a\u00f1o pasado por OpenAI, la compa\u00f1\u00eda respaldada por Microsoft detr\u00e1s de GPT-4.  Durante seis meses, este \u201cequipo rojo\u201d \u201cindagar\u00eda cualitativamente [and] probar adversarialmente\u201d el nuevo modelo, intentando romperlo. <\/p>\n<p>White le dijo al Financial Times que hab\u00eda usado GPT-4 para sugerir un compuesto que podr\u00eda actuar como un arma qu\u00edmica y us\u00f3 &#8220;complementos&#8221; que alimentaron el modelo con nuevas fuentes de informaci\u00f3n, como art\u00edculos cient\u00edficos y un directorio de fabricantes de productos qu\u00edmicos.  El chatbot incluso encontr\u00f3 un lugar para hacerlo. <\/p>\n<p>\u201cCreo que va a equipar a todos con una herramienta para hacer qu\u00edmica m\u00e1s r\u00e1pido y con mayor precisi\u00f3n\u201d, dijo.  \u201cPero tambi\u00e9n hay un riesgo significativo de personas.  .  .  haciendo qu\u00edmica peligrosa.  Ahora mismo, eso existe\u201d.<\/p>\n<p>Los hallazgos alarmantes permitieron a OpenAI garantizar que tales resultados no aparecieran cuando la tecnolog\u00eda se lanzara m\u00e1s ampliamente al p\u00fablico el mes pasado.<\/p>\n<p>De hecho, el ejercicio del equipo rojo fue dise\u00f1ado para abordar los temores generalizados sobre los peligros de implementar poderosos sistemas de IA en la sociedad.  El trabajo del equipo consist\u00eda en hacer preguntas inquisitivas o peligrosas para probar la herramienta que responde a consultas humanas con respuestas detalladas y matizadas. <\/p>\n<p>OpenAI quer\u00eda buscar problemas como la toxicidad, los prejuicios y los sesgos ling\u00fc\u00edsticos en el modelo.  As\u00ed que el equipo rojo hizo pruebas en busca de falsedades, manipulaci\u00f3n verbal y conocimientos cient\u00edficos peligrosos.  Tambi\u00e9n examinaron su potencial para ayudar e incitar al plagio, actividades ilegales como delitos financieros y ataques cibern\u00e9ticos, as\u00ed como tambi\u00e9n c\u00f3mo podr\u00eda comprometer la seguridad nacional y las comunicaciones en el campo de batalla. <\/p>\n<p>El FT habl\u00f3 con m\u00e1s de una docena del equipo rojo GPT-4.  Son una mezcla ecl\u00e9ctica de profesionales de cuello blanco: acad\u00e9micos, profesores, abogados, analistas de riesgos e investigadores de seguridad, y en gran parte con sede en EE. UU. y Europa. <\/p>\n<p>Sus hallazgos se enviaron a OpenAI, que los us\u00f3 para mitigar y &#8220;reentrenar&#8221; GPT-4 antes de lanzarlo m\u00e1s ampliamente.  Cada uno de los expertos pas\u00f3 de 10 a 40 horas probando el modelo durante varios meses.  A la mayor\u00eda de los entrevistados se les pag\u00f3 aproximadamente $100 por hora por el trabajo que hicieron, seg\u00fan varios entrevistados. <\/p>\n<p>Quienes hablaron con el FT compartieron preocupaciones comunes sobre el r\u00e1pido progreso de los modelos de lenguaje y, espec\u00edficamente, los riesgos de conectarlos a fuentes externas de conocimiento a trav\u00e9s de complementos.<\/p>\n<p>\u201cHoy el sistema est\u00e1 congelado, lo que significa que ya no aprende, ni tiene memoria\u201d, dijo Jos\u00e9 Hern\u00e1ndez-Orallo, parte del equipo rojo GPT-4 y profesor del Instituto Valenciano de Investigaci\u00f3n en Inteligencia Artificial.  \u201cPero \u00bfy si le damos acceso a internet?  Ese podr\u00eda ser un sistema muy poderoso conectado con el mundo\u201d. <\/p>\n<p>OpenAI dijo que se toma en serio la seguridad, prob\u00f3 los complementos antes del lanzamiento y actualizar\u00e1 GPT-4 regularmente a medida que m\u00e1s personas lo usen.<\/p>\n<p>Roya Pakzad, investigadora de tecnolog\u00eda y derechos humanos, us\u00f3 indicaciones en ingl\u00e9s y farsi para probar el modelo en busca de respuestas de g\u00e9nero, preferencias raciales y sesgos religiosos, espec\u00edficamente con respecto a cubrirse la cabeza. <\/p>\n<p>Pakzad reconoci\u00f3 los beneficios de una herramienta de este tipo para los hablantes no nativos de ingl\u00e9s, pero descubri\u00f3 que el modelo mostraba estereotipos abiertos sobre las comunidades marginadas, incluso en sus versiones posteriores. <\/p>\n<p>Tambi\u00e9n descubri\u00f3 que las llamadas alucinaciones, cuando el chatbot responde con informaci\u00f3n inventada, eran peores al probar el modelo en farsi, donde Pakzad encontr\u00f3 una mayor proporci\u00f3n de nombres, n\u00fameros y eventos inventados, en comparaci\u00f3n con el ingl\u00e9s. <\/p>\n<p>\u201cMe preocupa la posible disminuci\u00f3n de la diversidad ling\u00fc\u00edstica y la cultura detr\u00e1s de los idiomas\u201d, dijo. <\/p>\n<p>Boru Gollu, un abogado con sede en Nairobi que fue el \u00fanico probador africano, tambi\u00e9n not\u00f3 el tono discriminatorio de la modelo.  \u201cHubo un momento cuando estaba probando el modelo cuando actu\u00f3 como una persona blanca que me hablaba\u201d, dijo Gollu.  \u201cPreguntar\u00edas sobre un grupo en particular y te dar\u00eda una opini\u00f3n sesgada o un tipo de respuesta muy perjudicial\u201d.  OpenAI reconoci\u00f3 que GPT-4 a\u00fan puede exhibir sesgos. <\/p>\n<p>Los miembros del equipo rojo que evaluaron el modelo desde una perspectiva de seguridad nacional ten\u00edan opiniones diferentes sobre la seguridad del nuevo modelo.  Lauren Kahn, investigadora del Consejo de Relaciones Exteriores, dijo que cuando comenz\u00f3 a examinar c\u00f3mo se podr\u00eda usar la tecnolog\u00eda en un ataque cibern\u00e9tico a sistemas militares, dijo que &#8220;no esperaba que fuera tan detallado c\u00f3mo&#8221;. -A eso pude afinar\u201d. <\/p>\n<p>Sin embargo, Kahn y otros evaluadores de seguridad descubrieron que las respuestas del modelo se volvieron considerablemente m\u00e1s seguras durante el tiempo de prueba.  OpenAI dijo que entren\u00f3 a GPT-4 para rechazar solicitudes maliciosas de seguridad cibern\u00e9tica antes de su lanzamiento. <\/p>\n<p>Muchos miembros del equipo rojo dijeron que OpenAI hab\u00eda realizado una evaluaci\u00f3n de seguridad rigurosa antes del lanzamiento.  \u201cHan hecho un trabajo bastante bueno para deshacerse de la toxicidad manifiesta en estos sistemas\u201d, dijo Maarten Sap, experto en toxicidad del modelo de lenguaje en la Universidad Carnegie Mellon. <\/p>\n<p>Sap observ\u00f3 c\u00f3mo el modelo retrataba los diferentes g\u00e9neros y descubri\u00f3 que los sesgos reflejaban las disparidades sociales.  Sin embargo, Sap tambi\u00e9n descubri\u00f3 que OpenAI tom\u00f3 algunas decisiones activas pol\u00edticamente cargadas para contrarrestar esto. <\/p>\n<p>\u201cSoy una persona rara.  Me estaba esforzando mucho para que me convenciera de ir a la terapia de conversi\u00f3n.  Realmente me har\u00eda retroceder, incluso si asumiera una personalidad, como decir que soy religioso o del sur de Estados Unidos\u201d.<\/p>\n<p>Sin embargo, desde su lanzamiento, OpenAI se ha enfrentado a numerosas cr\u00edticas, incluida una queja ante la Comisi\u00f3n Federal de Comercio de un grupo de \u00e9tica tecnol\u00f3gica que afirma que GPT-4 es &#8220;parcial, enga\u00f1oso y un riesgo para la privacidad y la seguridad p\u00fablica&#8221;.<\/p>\n<p>Recientemente, la compa\u00f1\u00eda lanz\u00f3 una funci\u00f3n conocida como complementos de ChatGPT, a trav\u00e9s de los cuales las aplicaciones asociadas como Expedia, OpenTable e Instacart pueden dar acceso a ChatGPT a sus servicios, lo que le permite reservar y pedir art\u00edculos en nombre de usuarios humanos. <\/p>\n<p>Dan Hendrycks, un experto en seguridad de IA del equipo rojo, dijo que los complementos arriesgaban un mundo en el que los humanos estaban &#8220;fuera del circuito&#8221;. <\/p>\n<p>\u201c[W]\u00bfQu\u00e9 pasar\u00eda si un chatbot pudiera publicar su informaci\u00f3n privada en l\u00ednea, acceder a su cuenta bancaria o enviar a la polic\u00eda a su casa?\u201d  \u00e9l dijo.  \u201cEn general, necesitamos evaluaciones de seguridad mucho m\u00e1s s\u00f3lidas antes de permitir que las IA ejerzan el poder de Internet\u201d.<\/p>\n<aside aria-labelledby=\"aside-label\" class=\"n-content-recommended--single-story\">\n<p id=\"aside-label\" class=\"n-content-recommended__title\">Recomendado<\/p>\n<div class=\"o-teaser o-teaser--article o-teaser--small o-teaser--stacked o-teaser--has-image o-teaser--opinion js-teaser\" data-id=\"4f653300-7d71-4ee3-b89e-113091571c4e\">\n<div class=\"o-teaser__image-container js-teaser-image-container\">\n<div class=\"o-teaser__image-placeholder\" style=\"padding-bottom:56.2500%\"><\/div>\n<\/div>\n<\/div>\n<\/aside>\n<p>Los entrevistados tambi\u00e9n advirtieron que OpenAI no pod\u00eda detener las pruebas de seguridad solo porque su software estaba activo.  Heather Frase, que trabaja en el Centro de Seguridad y Tecnolog\u00eda Emergente de la Universidad de Georgetown, y prob\u00f3 GPT-4 con respecto a su capacidad para ayudar a los delitos, dijo que los riesgos continuar\u00edan creciendo a medida que m\u00e1s personas usaran la tecnolog\u00eda. <\/p>\n<p>\u201cLa raz\u00f3n por la que haces pruebas operativas es porque las cosas se comportan de manera diferente una vez que est\u00e1n en uso en el entorno real\u201d, dijo. <\/p>\n<p>Argument\u00f3 que se deber\u00eda crear un libro de contabilidad p\u00fablico para informar incidentes que surjan de modelos de lenguaje extenso, similares a los sistemas de informes de seguridad cibern\u00e9tica o fraude al consumidor. <\/p>\n<p>Sara Kingsley, economista laboral e investigadora, sugiri\u00f3 que la mejor soluci\u00f3n era anunciar claramente los da\u00f1os y riesgos, \u201ccomo una etiqueta nutricional\u201d. <\/p>\n<p>\u201cSe trata de tener un marco y saber cu\u00e1les son los problemas frecuentes para poder tener una v\u00e1lvula de seguridad\u201d, dijo.  \u201cPor eso digo que el trabajo nunca se termina\u201d.<\/p>\n<div class=\"n-content-layout\" data-layout-name=\"card\" data-layout-width=\"fullWidth\">\n<div class=\"n-content-layout__container\">\n<h2 id=\"members-of-the-gpt4-red-team-interviewed-by-the-ft-0\" class=\"n-content-heading-4\">Miembros del &#8216;equipo rojo&#8217; GPT-4 entrevistados por el FT<\/h2>\n<div class=\"n-content-layout__slot\" data-slot-width=\"true\">\n<figure class=\"n-content-image n-content-image--full\" style=\"width: 700px;max-width: 100%\">\n\t\t\t\t<img decoding=\"async\" alt=\"\" data-image-type=\"image\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2023\/04\/1681460029_830_El-equipo-rojo-de-OpenAI-los-expertos-contratados-para-romper.jpg\" \/><\/p>\n<\/figure>\n<p><strong>Paul Rottger<\/strong> <em>Instituto de Internet de Oxford, Reino Unido<br \/><\/em>Estudiante de doctorado centrado en el uso de IA para detectar discursos de odio en l\u00ednea<\/p>\n<p><strong>ana molinos<\/strong> <em>Instructor de ingl\u00e9s, College of Marin, EE. UU.<br \/><\/em>Profesor de escritura en un colegio comunitario, prueba de p\u00e9rdida de aprendizaje<\/p>\n<p><strong>Maarten savia<\/strong> <em>Universidad Carnegie Mellon, Estados Unidos<br \/><\/em>Profesor asistente, se especializa en la toxicidad de los resultados del modelo de lenguaje grande<\/p>\n<p><strong>sara reyesley<\/strong> <em>Universidad Carnegie Mellon, Estados Unidos<\/em> <br \/>Investigador de doctorado que se especializa en los mercados laborales en l\u00ednea y el impacto de la tecnolog\u00eda en el trabajo<\/p>\n<p><strong>boru gollo<\/strong> <em>TripleOKlaw LLP, Kenia<br \/><\/em>Abogado que ha estudiado oportunidades para la IA en Kenia<\/p>\n<p><strong>andres blanco<\/strong> <em>Universidad de Rochester, Estados Unidos<br \/><\/em>Profesor asociado, qu\u00edmico computacional, interesado en IA y dise\u00f1o de f\u00e1rmacos<\/p>\n<p><strong>Jos\u00e9 Hern\u00e1ndez-Orallo<\/strong> <em>Profesor, Instituto Valenciano de Investigaci\u00f3n en Inteligencia Artificial (VRAIN), Universitat Polit\u00e8cnica de Val\u00e8ncia, Espa\u00f1a<br \/><\/em>Investigador de IA que trabaja en la evaluaci\u00f3n y precisi\u00f3n del software de IA<\/p>\n<p><strong>lauren kahn<\/strong> <em>Consejo de Relaciones Exteriores, EE. UU.<br \/><\/em>Investigador, centrado en c\u00f3mo el uso de IA en sistemas militares altera la din\u00e1mica de riesgo en los campos de batalla, aumenta el riesgo de conflicto no intencionado y escalada inadvertida<\/p>\n<p><strong>Aviv Ovadia<\/strong> <em>Centro Berkman Klein para Internet y Sociedad, Universidad de Harvard, EE. UU.<br \/><\/em>Centrarse en los impactos de la IA en la sociedad y la democracia<\/p>\n<p><strong>nathan labenz<\/strong> <em>Co-fundador de Waymark, EE. UU.<br \/><\/em>Fundador de Waymark, una empresa emergente de edici\u00f3n de video basada en IA<\/p>\n<p><strong>Lexin Zhou<\/strong> <em>VRAIN, Universitat Polit\u00e8cnica de Val\u00e8ncia, Espa\u00f1a<br \/><\/em>Investigador junior que trabaja para hacer que la IA sea m\u00e1s beneficiosa socialmente<\/p>\n<p><strong>dan hendrycks<\/strong> <em>Director del Centro para la Seguridad de la IA en la Universidad de California, Berkeley, EE. UU.<br \/><\/em>Especialista en seguridad de IA y reducci\u00f3n de riesgos a escala social de la IA<\/p>\n<p><strong>Roya Pakzad<\/strong> <em>Fundador, Taraaz, EE. UU.\/Ir\u00e1n<br \/><\/em>Fundador y director de Taraaz, una organizaci\u00f3n sin fines de lucro que trabaja en tecnolog\u00eda y derechos humanos.<\/p>\n<p><strong>Frase de brezo<\/strong> <em>Senior Fellow, Centro de Seguridad y Tecnolog\u00eda Emergente de Georgetown, EE. UU.<br \/><\/em>Experiencia en el uso de IA con fines de inteligencia y pruebas operativas de los principales sistemas de defensa<\/p>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/www.ft.com\/content\/0876687a-f8b7-4b39-b513-5fee942831e8\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-56<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Despu\u00e9s de que Andrew White obtuviera acceso a GPT-4, el nuevo sistema de inteligencia artificial que impulsa el<\/p>\n","protected":false},"author":1,"featured_media":708309,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[131369,83260,1012,385,36,83672,18,5203,432],"class_list":["post-708308","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-chatgpt","tag-contratados","tag-equipo","tag-expertos","tag-los","tag-openai","tag-para","tag-rojo","tag-romper"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/708308","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=708308"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/708308\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/708309"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=708308"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=708308"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=708308"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}