
Manténgase informado con actualizaciones gratuitas
Simplemente regístrese en el Inteligencia artificial Myft Digest: entregado directamente a su bandeja de entrada.
Los grupos de inteligencia artificial chino han estado apresurando las actualizaciones de modelos antes de las vacaciones del Año Nuevo Lunar, ya que el mundo se despierta con los principales avances del sector liderados por la nueva empresa DeepSeek frente a las restricciones de chips estadounidenses.
El lunes, la víspera de las vacaciones anuales más importantes de China, la compañía con sede en Hangzhou lanzó un nuevo modelo de código abierto para la generación de imágenes, consolidando su reputación como el interruptor en jefe en un campo previamente dominado por los gigantes estadounidenses. Llegó a los pasos de lanzamientos modelo del gigante tecnológico Alibaba y las nuevas empresas Moonshot y Zhipu.
“Esto es el equivalente de lanzar un lanzamiento masivo en la víspera de Navidad. Todos hemos estado trabajando horas extras para sacar cosas antes de las vacaciones ”, dijo un gerente de productos en una nueva empresa de modelos de idiomas.
Si bien el logro de Deepseek ha provocado el pánico en los Estados Unidos sobre los avances que los laboratorios chinos están haciendo con los presupuestos de arranque, los expertos de la industria dicen que está alimentando una nueva “confianza” en China que estimulará la inversión.
“Deepseek ha progresado más rápido que las otras compañías modelo chinas. Pero esto les está dando confianza en que pueden ponerse al día ”, dijo un inversor de IA en China.
Deepseek ha captado la atención del mundo con una serie de lanzamientos modelo que muestran un rendimiento similar a los de los rivales estadounidenses como OpenAi y Meta, a pesar de que afirma tener una fracción de los recursos informáticos y está bloqueado de adquirir los últimos procesadores de Nvidia por nosotros Restricciones de exportación. La semana pasada, lanzó su modelo de razonamiento R1, un modelo avanzado que rivaliza con el O1 de Openai y puede aprender y mejorarse automáticamente sin supervisión humana.
“Deepseek ha inyectado mucha energía en los jugadores de IA de China y, en general, en la comunidad global de IA de código abierto que utilizará sus hallazgos de su papel R1 para avanzar en modelos de razonamiento”, dijo Wang Tiezhen, un ingeniero de AI Investigación Hub abrazando la cara.
Esta semana, los inversores arrojaron acciones relacionadas con la IA, con Nvidia perdiendo casi $ 600 mil millones en valor de mercado el lunes. Estaban reaccionando a los avances chinos que muestran que es posible construir modelos poderosos mientras persigue una estrategia diferente para los Estados Unidos, uno de los grupos de computación cada vez mayores para salir adelante en la carrera de IA.
El lunes, el QWEN de Alibaba lanzó Qwen2.5-1m, una serie de nuevos modelos que son capaces de manejar entradas más largas, un desarrollo importante que significaría que el modelo podría implementarse para aplicaciones de agentes de IA con mayores demandas de memoria, según Wang.
El mismo día, Deepseek lanzó a Janus-Pro, un modelo de generación de texto a imagen que afirma que puede superar los de última generación de competidores como Dall-E 3 de OpenAi y la difusión estable 3 de Stability AI en algunos puntos de referencia.
Zhipu, valorado en su última ronda de fondos en diciembre a $ 3 mil millones, la semana pasada lanzó una actualización de GLM-PC. El modelo de agente de IA está dirigido a clientes empresariales, lo que permite a las computadoras completar automáticamente tareas, como completar formularios o digerir informes financieros.
Si bien Zhipu no ha capacitado mucha atención para su desarrollo de LLM, tiene una ventaja entre las nuevas empresas locales de IA en la comercialización de su tecnología, con el apoyo de gobiernos locales y empresas estatales que se han asociado con la compañía con sede en Beijing para desplegar sus modelos .
La semana pasada, otra nueva empresa de puesta en marcha con sede en Beijing, propietaria del popular chatbot kimi de IA, actualizó su modelo de razonamiento a Kimi K1.5, que demuestra fuertes resultados en comparación con los modelos de IA establecidos para tareas de razonamiento complejas. La última versión puede procesar textos e imágenes mientras maneja consultas largas y complejas.
Es una práctica estándar para que las compañías tecnológicas chinas publiquen productos antes de las largas vacaciones, con el beneficio adicional de que los clientes potenciales con mucho tiempo libre durante el descanso pueden probarlos y explorarlos.
Una vez que los jugadores de IA chinos regresan de su descanso, la carrera se convertirá en el jugador líder que desarrolla aplicaciones de IA para uso comercial. “Si los agentes de IA pueden crear un valor comercial dramático, uno o dos de los jugadores de LLM tienen la oportunidad de transformarse en una nueva generación de compañías de software”, dijo el inversor de IA.

