{"id":129614,"date":"2022-05-04T15:36:14","date_gmt":"2022-05-04T15:36:14","guid":{"rendered":"https:\/\/teknomers.com\/es\/meta-hace-que-su-enorme-modelo-de-procesamiento-de-lenguaje-sea-de-codigo-abierto\/"},"modified":"2022-05-04T15:36:26","modified_gmt":"2022-05-04T15:36:26","slug":"meta-hace-que-su-enorme-modelo-de-procesamiento-de-lenguaje-sea-de-codigo-abierto","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/meta-hace-que-su-enorme-modelo-de-procesamiento-de-lenguaje-sea-de-codigo-abierto\/","title":{"rendered":"Meta hace que su enorme modelo de procesamiento de lenguaje sea de c\u00f3digo abierto"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Meta present\u00f3 su nuevo modelo de procesamiento de lenguaje para la investigaci\u00f3n de inteligencia artificial (IA) a principios de este mes.  Respondiendo al nombre de Open Pretrained Transformer (OPT-175B), ser\u00e1 completamente de c\u00f3digo abierto y se podr\u00e1 utilizar con fines no comerciales.  Estas plantillas se pueden usar para automatizar chatbots, traducir textos o incluso escribir hojas de productos.<\/p>\n<h2>Meta se inspir\u00f3 en el modelo OpenAI<\/h2>\n<p>El modelo comparte las mismas capacidades que el creado por OpenAI, una empresa cofundada por Elon Musk.  Al igual que GPT-3, tiene 175 mil millones de par\u00e1metros y se basa en el aprendizaje autom\u00e1tico.<\/p>\n<div class=\"alignfull-content\">\n<span class=\"purpley-grey\">En la misma categor\u00eda<\/span><\/p>\n<article class=\"grid-box anim col-12 post default post-read-also\">\n<div class=\"image\">\n<img decoding=\"async\" width=\"190\" height=\"190\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2022\/05\/Meta-hace-que-su-enorme-modelo-de-procesamiento-de-lenguaje.jpg\" class=\"attachment-post-ligne size-post-ligne wp-post-image\" alt=\"Descripci\u00f3n general de una moneda Etherum.\" loading=\"lazy\" \/> <\/div>\n<div class=\"content\">\n<h2>El lado oscuro del comercio de criptomonedas: insomnio, adicci\u00f3n, depresi\u00f3n<\/h2>\n<\/div>\n<\/article>\n<\/div>\n<p>Si se pensaba que OPT-175B se parec\u00eda tanto a su hermano mayor, es intencional.  Seg\u00fan Joelle Pineau, codirectora ejecutiva de Facebook AI Research, el modelo se dise\u00f1\u00f3 para que el nivel de precisi\u00f3n de las tareas ling\u00fc\u00edsticas y su toxicidad coincidieran con los de GPT-3.<\/p>\n<p>\u00bfLa idea detr\u00e1s de esto?  Haga que su c\u00f3digo sea de c\u00f3digo abierto para permitir que los investigadores de todos los \u00e1mbitos de la vida contribuyan a su desarrollo de forma gratuita.  Efectivamente, OpenAI hab\u00eda accedido a su API pagando.  Debido a esto, solo los laboratorios m\u00e1s ricos pudieron realizar investigaciones sobre su modelo de procesamiento del lenguaje.<\/p>\n<p>&#8221; <em>Creemos que toda la comunidad de IA (investigadores acad\u00e9micos, sociedad civil, legisladores e industria) debe poder trabajar en conjunto para desarrollar pautas claras sobre inteligencia artificial y modelos de lenguajes grandes y responsables.<\/em> \u201cexplic\u00f3 Meta en <a rel=\"nofollow noopener\" href=\"https:\/\/ai.facebook.com\/blog\/democratizing-access-to-large-scale-language-models-with-opt-175b\/\" target=\"_blank\">su comunicado de prensa<\/a>.<\/p>\n<h2>Hacer que la tecnolog\u00eda sea m\u00e1s transparente<\/h2>\n<p>Garantizar que la tecnolog\u00eda sea cada vez m\u00e1s transparente siempre ha sido el caballo de batalla de Joelle Pineau.  &#8221; <em>Este compromiso con la ciencia abierta es la raz\u00f3n por la que estoy [chez Meta].  No estar\u00e9 all\u00ed en otras condiciones.<\/em> \u201c, dijo el investigador en una entrevista con <a rel=\"nofollow noopener\" href=\"https:\/\/www.technologyreview.com\/2022\/05\/03\/1051691\/meta-ai-large-language-model-gpt3-ethics-huggingface-transparency\/\" target=\"_blank\"><em>Revisi\u00f3n de tecnolog\u00eda del MIT<\/em><\/a>.<\/p>\n<p>Meta no es la empresa m\u00e1s dispuesta a compartir sus secretos.  Ha revelado muy poco del funcionamiento de sus algoritmos y prefiere m\u00e1s bien ocultar sus errores.  Sin embargo, Joelle Pineau logr\u00f3 que el OPT-175B fuera de c\u00f3digo abierto y estuviera disponible para fines no comerciales.<\/p>\n<p>El grupo tambi\u00e9n lanz\u00f3 el c\u00f3digo del modelo completo y un libro de registro para documentar el proceso de entrenamiento de IA.  Esto ya contiene 3 meses de investigaci\u00f3n, desde octubre de 2021 hasta enero de 2022, y enumera todos los errores, fallas y reinicios encontrados.<\/p>\n<p>Los modelos de procesamiento de lenguaje natural se han convertido en el pr\u00f3ximo santo grial de la inteligencia artificial.  Sin embargo, estos contienen fallas profundas, incluida la transmisi\u00f3n de informaci\u00f3n falsa, el uso de prejuicios racistas y sexistas y lenguaje t\u00f3xico.  Estos problemas est\u00e1n relacionados con los textos utilizados por el modelo para entrenar y desarrollar.<\/p>\n<p>GPT-3 ha pagado el precio muchas veces.  En octubre de 2020, la empresa Nabla estaba probando este modelo en el \u00e1mbito m\u00e9dico cuando aconsej\u00f3 a un falso paciente acabar con su vida.  Por lo tanto, hacer que el c\u00f3digo de los modelos de procesamiento del lenguaje sea libremente accesible en su totalidad permitir\u00eda corregir estas complicaciones de manera m\u00e1s efectiva.<\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/siecledigital.fr\/2022\/05\/04\/meta-rend-open-source-son-enorme-modele-de-traitement-de-langage\/\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-4<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Meta present\u00f3 su nuevo modelo de procesamiento de lenguaje para la investigaci\u00f3n de inteligencia artificial (IA) a principios<\/p>\n","protected":false},"author":1,"featured_media":129615,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[44,706,5970,1740,14525,7278,2832,16952,15],"class_list":["post-129614","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-abierto","tag-codigo","tag-enorme","tag-hace","tag-lenguaje","tag-meta","tag-modelo","tag-procesamiento","tag-sea"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/129614","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=129614"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/129614\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/129615"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=129614"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=129614"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=129614"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}