{"id":40058,"date":"2022-03-17T17:05:09","date_gmt":"2022-03-17T17:05:09","guid":{"rendered":"https:\/\/teknomers.com\/es\/un-truco-matematico-podria-reducir-a-la-mitad-el-tiempo-de-desarrollo-de-la-inteligencia-artificial\/"},"modified":"2022-03-17T17:05:18","modified_gmt":"2022-03-17T17:05:18","slug":"un-truco-matematico-podria-reducir-a-la-mitad-el-tiempo-de-desarrollo-de-la-inteligencia-artificial","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/un-truco-matematico-podria-reducir-a-la-mitad-el-tiempo-de-desarrollo-de-la-inteligencia-artificial\/","title":{"rendered":"Un truco matem\u00e1tico podr\u00eda reducir a la mitad el tiempo de desarrollo de la inteligencia artificial"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Puede entrenar la inteligencia artificial para que reconozca rostros, por ejemplo, pero antes de que eso tenga \u00e9xito, la IA primero debe tomar millones de pasos de pr\u00e1ctica.  Una nueva forma de entrenar la IA ahorra tiempo, energ\u00eda y potencia inform\u00e1tica.<\/p>\n<p><!--more--><\/p>\n<p>La inteligencia artificial (IA) est\u00e1 mejorando en la realizaci\u00f3n de tareas complejas, pero entrenar la IA requiere una enorme cantidad de poder de c\u00f3mputo.  Una t\u00e9cnica m\u00e1s eficiente podr\u00eda reducir a la mitad el tiempo, la energ\u00eda y la potencia inform\u00e1tica necesaria.<\/p>\n<p>La inteligencia artificial a menudo utiliza un m\u00e9todo que <em><a rel=\"nofollow noopener\" href=\"https:\/\/nl.wikipedia.org\/wiki\/Deep_learning\" data-type=\"URL\" data-id=\"https:\/\/nl.wikipedia.org\/wiki\/Deep_learning\" target=\"_blank\">aprendizaje profundo<\/a><\/em>  se llama.  La IA consiste en una red de &#8216;c\u00e9lulas nerviosas&#8217; artificiales.  Estos est\u00e1n vinculados entre s\u00ed por un c\u00f3digo de computadora, que toma entradas, les asigna un cierto peso y luego devuelve una salida alterada.  De esta forma, la red se parece a una versi\u00f3n aproximada de nuestro cerebro, en la que las c\u00e9lulas nerviosas est\u00e1n conectadas entre s\u00ed.<\/p>\n<p>\t\t\tLEA TAMBI\u00c9N<br \/>bestias brillantes\n\t\t\t<\/p>\n<p>Al asignar diferentes pesos a la entrada, la red puede aprender de manera lenta pero segura una determinada tarea, como reconocer rostros o digitalizar textos escritos a mano.  Antes de que eso tenga \u00e9xito, la red tiene que cambiar los pesos asignados miles o millones de veces.<\/p>\n<h2>De ida y vuelta <\/h2>\n<p>Para entrenar un modelo, los investigadores env\u00edan datos a la red, luego de lo cual eval\u00faan la calidad de la salida.  Luego calculan un &#8220;gradiente&#8221;: un valor que dicta c\u00f3mo deben cambiar los pesos para mejorar el resultado.  Durante este proceso, los datos se mueven constantemente de un lado a otro a trav\u00e9s de la red, estableciendo lentamente el gradiente.<\/p>\n<p><a rel=\"nofollow noopener\" href=\"https:\/\/gbaydin.github.io\/\" target=\"_blank\">At\u0131l\u0131m Gune\u015f Baydin<\/a>, un investigador de IA de la Universidad de Oxford, ahora ha simplificado ese proceso con sus colegas.  En lugar de tener que realizar el proceso en dos pasos, con los datos yendo y viniendo, ahora se puede realizar en <a rel=\"nofollow noopener\" href=\"https:\/\/arxiv.org\/abs\/2202.08587\" target=\"_blank\">un paso<\/a>\u2020  El gradiente se establece con tanta precisi\u00f3n en el primer paso que ya no es necesario un segundo c\u00e1lculo. <\/p>\n<p>En teor\u00eda, esto podr\u00eda reducir a la mitad el tiempo de desarrollo de la IA.  El equipo compar\u00f3 su nuevo modelo de IA con un modelo &#8220;anticuado&#8221; y vio que su IA realizaba sus tareas igual de bien.<\/p>\n<h2>truco matem\u00e1tico<\/h2>\n<p>Calcular el gradiente en un solo paso es un &#8216;truco matem\u00e1tico simple&#8217;, dice <a rel=\"nofollow noopener\" href=\"http:\/\/emps.exeter.ac.uk\/computer-science\/staff\/ajc271\" target=\"_blank\">andres corbett<\/a>\u2020  Es inform\u00e1tico en la Universidad de Exeter.  Ese simple truco podr\u00eda resolver potencialmente uno de los mayores problemas para los investigadores de IA: el poder de c\u00f3mputo cada vez mayor requerido.<\/p>\n<p>Seg\u00fan Corbett, esto podr\u00eda proporcionar una forma m\u00e1s econ\u00f3mica de entrenar la IA.  &#8216;Es muy importante resolver el problema de [gebrek aan rekenkracht] para resolver, porque esa es la <em>embotellamiento<\/em> de algoritmos de IA.&#8217;<\/p>\n<h2>s\u00faper computadoras<\/h2>\n<p>Los sistemas de IA modernos utilizan miles de millones de datos.  Lleva semanas o meses entrenar las supercomputadoras gigantes necesarias. <\/p>\n<p>Una de las redes neuronales m\u00e1s grandes en uso es la <em>Generaci\u00f3n de lenguaje natural Megatron-Turing<\/em>modelo, que contiene 530 mil millones de datos.  Est\u00e1 entrenado con la supercomputadora Selene de Nvidia, que consta de 560 potentes servidores y 4480 tarjetas gr\u00e1ficas.  Cada una de esas tarjetas cuesta miles de euros.  A pesar del enorme poder de c\u00f3mputo de la m\u00e1quina, lleva m\u00e1s de un mes entrenar este modelo.<\/p>\n<h2>reducir a la mitad<\/h2>\n<p>En el mejor de los casos, la potencia inform\u00e1tica ahora se ha reducido a la mitad, pero eso est\u00e1 lejos de ser seguro, dice G\u00fcne\u015f Baydin.  La eficiencia del m\u00e9todo solo quedar\u00e1 clara cuando otros investigadores lo utilicen para todo tipo de tareas diferentes de IA.  Para algunas aplicaciones puede funcionar mejor que otras.<\/p>\n<p>\u201cPuede realizar un solo c\u00e1lculo de optimizaci\u00f3n m\u00e1s r\u00e1pido con este algoritmo, pero eso no significa necesariamente que funcione el doble de r\u00e1pido a gran escala.  Hay m\u00e1s factores involucrados en esto&#8217;, dice.  &#8216;En algunos casos, puede funcionar peor que el m\u00e9todo anterior y solo necesita m\u00e1s c\u00e1lculos para lograr la misma calidad de entrenamiento.  Y si eso sucede, es posible que el nuevo m\u00e9todo no pueda competir con el antiguo.&#8217;<\/p>\n<\/p><\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/www.newscientist.nl\/nieuws\/wiskundige-truc-kan-ontwikkelingstijd-van-kunstmatige-intelligentie-halveren\/\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-76<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Puede entrenar la inteligencia artificial para que reconozca rostros, por ejemplo, pero antes de que eso tenga \u00e9xito,<\/p>\n","protected":false},"author":1,"featured_media":40059,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[9],"tags":[118,857,117,29575,265,2916,2565,448,9625],"class_list":["post-40058","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-tecnologia","tag-artificial","tag-desarrollo","tag-inteligencia","tag-matematico","tag-mitad","tag-podria","tag-reducir","tag-tiempo","tag-truco"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/40058","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=40058"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/40058\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/40059"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=40058"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=40058"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=40058"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}