{"id":1616325,"date":"2025-03-11T08:01:13","date_gmt":"2025-03-11T08:01:13","guid":{"rendered":"https:\/\/teknomers.com\/es\/como-la-inferencia-esta-impulsando-la-competencia-al-dominio-de-chip-de-ai-de-nvidia\/"},"modified":"2025-03-11T08:01:18","modified_gmt":"2025-03-11T08:01:18","slug":"como-la-inferencia-esta-impulsando-la-competencia-al-dominio-de-chip-de-ai-de-nvidia","status":"publish","type":"post","link":"https:\/\/teknomers.com\/es\/como-la-inferencia-esta-impulsando-la-competencia-al-dominio-de-chip-de-ai-de-nvidia\/","title":{"rendered":"C\u00f3mo la &#8216;inferencia&#8217; est\u00e1 impulsando la competencia al dominio de Chip de Ai de Nvidia"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div id=\"article-body\">\n<p>Los retadores de Nvidia est\u00e1n aprovechando una nueva oportunidad para descifrar su dominio de las chips de inteligencia artificiales despu\u00e9s de que Deepseek de Startup china aceler\u00f3 un cambio en los requisitos inform\u00e1ticos de la IA. <\/p>\n<p>Deepseek&#8217;s R1 y otros llamados modelos de &#8220;razonamiento&#8221;, como el O3 de OpenAI y Claude 3.7 de Anthrope, consumen m\u00e1s recursos inform\u00e1ticos que los sistemas de IA anteriores en el momento en que un usuario hace su solicitud, un proceso llamado &#8220;inferencia&#8221;. <\/p>\n<p>Eso ha volcado el enfoque de la demanda de computaci\u00f3n de IA, que hasta hace poco se centr\u00f3 en la capacitaci\u00f3n o en la creaci\u00f3n de un modelo. Se espera que la inferencia se convierta en una mayor parte de las necesidades de la tecnolog\u00eda a medida que la demanda crece entre individuos y empresas para aplicaciones que van m\u00e1s all\u00e1 de los chatbots populares de hoy, como ChatGPT o Xai&#8217;s Grok. <\/p>\n<p>Es aqu\u00ed donde los competidores de Nvidia, que van desde nuevas empresas de chips de IA, como cerebras y groq hasta procesadores de aceleradores personalizados de grandes compa\u00f1\u00edas tecnol\u00f3gicas, incluidas Google, Amazon, Microsoft y Meta, est\u00e1n centrando sus esfuerzos para interrumpir la compa\u00f1\u00eda de semiconductores m\u00e1s valiosa del mundo. <\/p>\n<p>&#8220;La capacitaci\u00f3n hace que la IA y la inferencia usen IA&#8221;, dijo Andrew Feldman, director ejecutivo de Cerebras. \u201cY el uso de la IA se ha ido por el techo. . . La oportunidad en este momento de hacer un chip que sea mucho mejor para la inferencia que para el entrenamiento es m\u00e1s grande de lo que ha sido anteriormente &#8220;.<\/p>\n<p>Nvidia domina el mercado de grandes grupos inform\u00e1ticos como la instalaci\u00f3n XAI de Elon Musk en Memphis o el proyecto Stargate de OpenAi con SoftBank. Pero sus inversores est\u00e1n buscando la seguridad de que puede continuar superando a sus rivales en centros de datos mucho m\u00e1s peque\u00f1os en construcci\u00f3n que se centrar\u00e1n en la inferencia. <\/p>\n<p>Vipul Ved Prakash, director ejecutivo y cofundador de Together AI, un proveedor de la nube centrado en la IA que fue valorado en $ 3.3 mil millones el mes pasado en una ronda dirigida por el Catalyst General, dijo que la inferencia fue un &#8220;gran enfoque&#8221; para su negocio. &#8220;Creo que ejecutar la inferencia a escala ser\u00e1 la mayor carga de trabajo en Internet en alg\u00fan momento&#8221;, dijo. <\/p>\n<p>Los analistas de Morgan Stanley han estimado que m\u00e1s del 75 por ciento de la demanda de potencia y computaci\u00f3n de centros de datos en los Estados Unidos ser\u00e1 por inferencia en los pr\u00f3ximos a\u00f1os, aunque advirtieron sobre &#8220;incertidumbre significativa&#8221; sobre c\u00f3mo se desarrollar\u00e1 la transici\u00f3n. <\/p>\n<p>A\u00fan as\u00ed, eso significa que cientos de miles de millones de d\u00f3lares en inversiones podr\u00edan fluir hacia instalaciones de inferencia en los pr\u00f3ximos a\u00f1os, si el uso de IA contin\u00faa creciendo a su ritmo actual. <\/p>\n<p>Los analistas de Barclays estiman el gasto de capital por inferencia en &#8220;Frontier AI&#8221;, que se refieren a los sistemas m\u00e1s grandes y avanzados, exceder\u00e1n el de la capacitaci\u00f3n en los pr\u00f3ximos dos a\u00f1os, saltando de $ 122.6 mil millones en 2025 a $ 208.2 mil millones en 2026. <\/p>\n<figure class=\"n-content-image n-content-image--full\" data-component=\"image-set\"><picture><source media=\"(min-width: 700px)\"  width=\"3500\" height=\"2500\"\/><source media=\"(max-width: 490px)\"  width=\"1500\" height=\"2000\"\/><\/picture><\/figure>\n<p>Si bien Barclays predice que Nvidia tendr\u00e1 &#8220;cuota de mercado esencialmente al 100 por ciento&#8221; en la capacitaci\u00f3n de IA fronteriza, solo servir\u00e1 al 50 por ciento de la inform\u00e1tica de inferencia &#8220;a largo plazo&#8221;. Eso deja a los rivales de la compa\u00f1\u00eda con casi $ 200 mil millones en gastos de chips para jugar para 2028. <\/p>\n<p>&#8220;Hay un gran tir\u00f3n hacia mejor, m\u00e1s r\u00e1pido y m\u00e1s eficiente [chips]&#8221;, Dijo Walter Goodwin, fundador de la nueva empresa de chips con sede en el Reino Unido Fractup. Los proveedores de computaci\u00f3n en la nube est\u00e1n ansiosos por &#8220;algo que corta la sobredependencia&#8221; en Nvidia, agreg\u00f3. <\/p>\n<p>El presidente ejecutivo de NVIDIA, Jensen Huang, insisti\u00f3 en que los chips de su compa\u00f1\u00eda son tan poderosos para la inferencia como para capacitar, ya que mira una nueva oportunidad de mercado gigante. <\/p>\n<p>Los \u00faltimos chips Blackwell de la compa\u00f1\u00eda estadounidense fueron dise\u00f1ados para manejar mejor la inferencia y muchos de los primeros clientes de esos productos los est\u00e1n utilizando para servir, en lugar de entrenar, sistemas de inteligencia artificial. La popularidad de su software, basada en su arquitectura CUDA patentada, entre los desarrolladores de IA tambi\u00e9n presenta una barrera formidable para los competidores. <\/p>\n<p>&#8220;La cantidad de c\u00f3mputo de inferencia necesaria ya es 100 veces m\u00e1s&#8221; que cuando comenz\u00f3 los modelos de idiomas grandes, dijo Huang en la llamada de ganancias del mes pasado. &#8220;Y ese es solo el comienzo&#8221;. <\/p>\n<p>El costo de servir respuestas de LLMS ha ca\u00eddo r\u00e1pidamente en los \u00faltimos dos a\u00f1os, impulsado por una combinaci\u00f3n de chips m\u00e1s potentes, sistemas de IA m\u00e1s eficientes y una intensa competencia entre desarrolladores de IA como Google, OpenAi y Anthrope. <\/p>\n<p>&#8220;El costo de usar un nivel dado de AI cae alrededor de 10 veces cada 12 meses, y los precios m\u00e1s bajos conducen a mucho m\u00e1s uso&#8221;, dijo Sam Altman, director ejecutivo de OpenAi, en una publicaci\u00f3n de blog el mes pasado. <\/p>\n<p>Los modelos V3 y R1 de Deepseek, que desencadenaron un p\u00e1nico en el mercado de valores en enero en gran parte debido a lo que se percibi\u00f3 como costos de capacitaci\u00f3n m\u00e1s bajos, han ayudado a reducir a\u00fan m\u00e1s los costos de inferencia, gracias a las innovaciones arquitect\u00f3nicas y la eficiencia de codificaci\u00f3n de la nueva empresa china. <\/p>\n<p>Al mismo tiempo, el tipo de procesamiento requerido por las tareas de inferencia, que pueden incluir requisitos de memoria mucho mayores para responder consultas m\u00e1s largas y m\u00e1s complejas, abri\u00f3 la puerta a alternativas a las unidades de procesamiento de gr\u00e1ficos de NVIDIA, cuyas fortalezas radican en el manejo de vol\u00famenes muy grandes de c\u00e1lculos similares. <\/p>\n<p>&#8220;El rendimiento de la inferencia en su hardware es una funci\u00f3n de lo r\u00e1pido que puede [move data] hacia y desde la memoria &#8220;, dijo Feldman de Cerebras, cuyos chips han sido utilizados por la empresa francesa de IA Mistral para acelerar el rendimiento de su chatbot, le chat. <\/p>\n<aside aria-labelledby=\"aside-label\" class=\"n-content-recommended--single-story n-content-recommended--inset\" data-component=\"recommended\">\n<p class=\"n-content-recommended__title\">Recomendado<\/p>\n<div class=\"o-teaser o-teaser--article o-teaser--small o-teaser--stacked o-teaser--has-image js-teaser\" data-id=\"ee83c24c-9099-42a4-85c9-165e7af35105\">\n<div class=\"o-teaser__image-container js-teaser-image-container\">\n<div class=\"o-teaser__image-placeholder\" style=\"aspect-ratio:2493\/1402\"><img decoding=\"async\" class=\"o-teaser__image\" src=\"https:\/\/teknomers.com\/es\/wp-content\/uploads\/2025\/03\/Como-la-inferencia-esta-impulsando-la-competencia-al-dominio-de.net.jpeg\" alt=\"Un montaje de Jensen Huang con logotipos de Deepseek y Nvidia\"\/><\/div>\n<\/div>\n<\/div>\n<\/aside>\n<p>La velocidad es vital para involucrar a los usuarios, dijo Feldman. &#8220;Una de las cosas que google [search] Mostrado hace 25 a\u00f1os es que incluso microsegundos [of delay] Reduce la atenci\u00f3n del espectador \u201d, dijo. \u201cEstamos produciendo respuestas para LE Chat a veces un segundo [OpenAI\u2019s] O1 habr\u00eda tomado 40. &#8221; <\/p>\n<p>Nvidia mantiene que sus chips son tan poderosos para la inferencia como para el entrenamiento, lo que se\u00f1ala 200 veces mejorado en su rendimiento de inferencia en los \u00faltimos dos a\u00f1os. Dice que cientos de millones de usuarios acceden a los productos AI a trav\u00e9s de millones de GPU hoy. <\/p>\n<p>&#8220;Nuestra arquitectura es fungible y f\u00e1cil de usar de todas esas formas diferentes&#8221;, dijo Huang el mes pasado, tanto para construir modelos grandes como para servir aplicaciones de IA de nuevas maneras.<\/p>\n<p>Prakash, cuya compa\u00f1\u00eda cuenta con Nvidia como inversor, dijo que juntas usan los mismos chips Nvidia para inferencia y capacitaci\u00f3n hoy, lo cual es &#8220;bastante \u00fatil&#8221;. <\/p>\n<p>A diferencia de las GPU de &#8220;prop\u00f3sito general&#8221; de NVIDIA, los aceleradores de inferencia funcionan mejor cuando se ajustan a un tipo particular de modelo de IA. En una industria de r\u00e1pido movimiento, eso podr\u00eda ser un problema para las nuevas empresas de chips que se apuestan por la arquitectura de IA equivocada. <\/p>\n<p>&#8220;Creo que la \u00fanica ventaja de la computaci\u00f3n de prop\u00f3sito general es que a medida que las arquitecturas modelo est\u00e1n cambiando, solo tiene m\u00e1s flexibilidad&#8221;, dijo Prakash, al tiempo que agrega: &#8220;Mi sentido es que habr\u00e1 una compleja combinaci\u00f3n de silicio en los pr\u00f3ximos a\u00f1os&#8221;. <\/p>\n<p><em>Informes adicionales de Michael Acton en San Francisco<\/em><\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/www.ft.com\/content\/d5c638ad-8d34-4884-a08c-a551588a9a28\" rel=\"nofollow noopener\" target=\"_blank\">ttn-es-56<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Los retadores de Nvidia est\u00e1n aprovechando una nueva oportunidad para descifrar su dominio de las chips de inteligencia<\/p>\n","protected":false},"author":1,"featured_media":1616326,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[3949,440,3738,3562,97,20842,285288,11108],"class_list":["post-1616325","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-general","tag-chip","tag-como","tag-competencia","tag-dominio","tag-esta","tag-impulsando","tag-inferencia","tag-nvidia"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1616325","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/comments?post=1616325"}],"version-history":[{"count":0,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/posts\/1616325\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media\/1616326"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/media?parent=1616325"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/categories?post=1616325"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/es\/wp-json\/wp\/v2\/tags?post=1616325"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}