
Manténgase informado con actualizaciones gratuitas
Simplemente regístrese en el Inteligencia artificial Myft Digest: entregado directamente a su bandeja de entrada.
Operai dice que ha encontrado evidencia de que la nueva empresa de inteligencia artificial china Deepseek utilizó los modelos propietarios de la compañía estadounidense para capacitar a su propio competidor de código abierto, a medida que crecen las preocupaciones sobre una posible violación de la propiedad intelectual.
El fabricante de chatgpt con sede en San Francisco le dijo al Financial Times que había visto alguna evidencia de “destilación”, una técnica utilizada por los desarrolladores para obtener un mejor rendimiento en modelos más pequeños mediante el uso de salidas de modelos más grandes y más capaces. Esto les permite lograr resultados similares en tareas específicas a un costo mucho más bajo.
Operai declinó hacer más información sobre los detalles de su evidencia. Sus términos de servicio de los usuarios de estado no pueden “copiar” ninguno de sus servicios o “usar la salida para desarrollar modelos que compitan con OpenAI”.
El lanzamiento de Deepseek de su modelo de razonamiento R1 ha sorprendido a los mercados, así como a los inversores y compañías de tecnología en Silicon Valley, debido a su impresionante desempeño en las tareas cognitivas. Sus modelos construidos sobre una shoesta han alcanzado altas clasificaciones y resultados comparables a los principales modelos estadounidenses. Las acciones en Nvidia cayeron un 17 por ciento el lunes, limpiando $ 589 mil millones de su valor de mercado, por temor a que no se necesitaran grandes inversiones en su costoso hardware de IA. Se recuperaron en un 9 por ciento el martes.
Una persona cercana a OpenAI dijo que la destilación era una práctica común en la industria y destacó que la compañía ofrece a los desarrolladores una forma de hacerlo utilizando su propia plataforma, pero dijo: “El problema es cuando lo está haciendo para crear su propio modelo para tus propios propósitos “.
Microsoft y Openai realizaron investigaciones sobre cuentas que se cree que son el otoño pasado de Deepseek que estaba utilizando la interfaz de programación de aplicaciones de OpenAI, o API, y bloquearon su acceso con sospecha de destilación que violó los términos de servicio, otra persona con conocimiento directo agregado y, como se informó primero, por Bloomberg.
Microsoft declinó hacer comentarios y OpenAI no respondió de inmediato a este detalle. Deepseek no respondió de inmediato a una solicitud de comentarios.
Anteriormente, la IA del presidente Donald Trump, y cripto zar de cripto David, Sacks, dijo “es posible” que haya ocurrido robo de IP.
“Hay una técnica en IA llamada destilación. . . Cuando un modelo aprende de otro modelo [and] Algo así apesta el conocimiento del modelo matriz ”, dijo Sacks a Fox News el martes.
“Y hay evidencia sustancial de que lo que hizo Deepseek aquí es que destilaron el conocimiento de los modelos Operai, y no creo que OpenAi esté muy contento con esto”, agregó Sacks, aunque no proporcionó evidencia.
Deepseek dijo que usó solo 2,048 tarjetas gráficas NVIDIA H800 y $ 5.6MN para entrenar su modelo V3 con parámetros de 671 mil millones, una fracción de lo que OpenAi y Google gastaron para entrenar modelos de tamaño comparable. Algunos expertos señalaron cómo el modelo generó respuestas que indicaban que había sido entrenada en salidas del GPT-4 de Opensei, lo que violaría sus términos de servicio.
Los expertos de la industria dicen que, en realidad, es una práctica común para AI Labs, tanto en China como en los Estados Unidos, para usar los resultados de compañías líderes como OpenAI.
Los líderes de la industria como OpenAI han invertido en la contratación de personas para enseñar a sus modelos cómo producir respuestas que suenan más humanas. Esto es costoso e intensivo en el trabajo, y los expertos de la industria dicen que es común que los jugadores más pequeños se ganen su trabajo.
“Es una práctica muy común para las nuevas empresas y los académicos usar resultados de LLM comerciales alineados por humanos, como ChatGPT, para capacitar a otro modelo”, dijo Ritwik Gupta, candidato a doctorado en IA en la Universidad de California, Berkeley.
“Eso significa que obtienes este paso de comentarios humanos gratis. No es sorprendente para mí que Deepseek supuestamente estaría haciendo lo mismo. Si lo fueran, detener esta práctica con precisión puede ser difícil ”, agregó.
La práctica también destaca la dificultad para las empresas fronterizas en la IA en la forma en que defienden su ventaja técnica cuando otros grupos pueden aprovechar sus modelos.
Las compañías chinas han absorbido rápidamente las lecciones de sus homólogos estadounidenses mientras innovan enfoques para maximizar su número limitado de chips, lo que hace que sea más barato entrenar y ejecutar los modelos.
“Sabemos [China]-Las empresas basadas en las basadas, y otras, están constantemente tratando de destilar los modelos de las principales compañías de IA de EE. UU. ”, Agregó Openii en un comunicado.
“Nos involucramos en contramedidas para proteger nuestra IP, incluido un proceso cuidadoso para el cual las capacidades fronterizas para incluir en los modelos lanzados, y creemos a medida que avanzamos, es muy importante que estemos trabajando estrechamente con el gobierno de los Estados Unidos para proteger mejor a los más capaces. modelos de esfuerzos de adversarios y competidores para llevarnos la tecnología “.
Actualmente, Operai está luchando contra las acusaciones de su propia infracción de derechos de autor de periódicos y creadores de contenido, incluidas demandas del New York Times y autores prominentes, que acusan a la compañía de capacitar a sus modelos en sus artículos y libros sin permiso.


