Son modèle n'est pas seulement puissant et gratuit, mais il a également coûté beaucoup moins cher.

OpenAI : Un Tournant Stratégique avec les Modèles Ouverts

OpenAI a effectué un virage significatif dans sa stratégie en lançant ses premiers modèles avec poids ouverts depuis 2019 : gpt-oss-120b et gpt-oss-20b. Ces nouveaux systèmes de raisonnement représentent un changement radical suite au succès de DeepSeek R1 en début d’année. Pourquoi cette annonce est-elle si pertinente pour le monde de l’intelligence artificielle ?

Importance du Changement

Jusqu’à récemment, OpenAI avait opté pour des modèles fermés, justifiant cette approche par des raisons de sécurité. Cependant, dans un retournement surprenant, la société a reconnu avoir eu tort et a décidé de passer aux modèles ouverts, soulignant qu’elle était “du mauvais côté de l’histoire”. Ce changement a été précipité par la révolution que DeepSeek a engendrée, incitant OpenAI à réévaluer ses orientations.

Le Contexte Concurrentiel

Avant l’arrivée de ces nouveaux modèles, OpenAI a maintenu son avance grâce à des modèles fermés, depuis GPT-2. Cependant, des entreprises concurrentes comme Meta avec Llama et plusieurs sociétés chinoises comme DeepSeek, Qwen et Kimi ont progressivement gagné du terrain dans l’écosystème ouvert. Ce climat compétitif a mis une pression significative sur OpenAI pour innover.

Les Détails des Nouveaux Modèles

Le modèle le plus imposant, gpt-oss-120b, est capable de fonctionner sur une seule GPU de 80 Go, n’utilisant qu’une fraction de ses 117 milliards de paramètres, précisément 5,1 milliards actifs par requête. En revanche, son homologue, gpt-oss-20b, peut s’exécuter sur un ordinateur portable avec 16 Go de mémoire, bien que les performances puissent être limitées dans cette configuration.

Performances en Chiffres

Les performances des modèles sont impressionnantes. Selon les benchmarks indépendants, gpt-oss-120b obtient une note de 58 dans l’Indice de l’Intelligence, dépassant d’autres modèles comme o3-mini mais restant derrière o3 et o4-mini. En matière de programmation compétitive, il atteint un score de 2622 sur Codeforces, surpassant de lourds concurrents comme DeepSeek R1.

Système de Mixage d’Experts

Une des caractéristiques innovantes de ces modèles réside dans leur architecture utilisant le système de mixage d’experts (MoE). Ce système permet d’activer seulement une petite partie des paramètres pour chaque requête, rendant le processus d’inférence plus efficace. Par exemple, pour le modèle de 120 milliards de paramètres, seulement 4,4% sont actifs à chaque requête, tandis que pour celui de 20 milliards, ce chiffre s’élève à 17,2%.

Raison et Supervision

Un autre aspect important de ces modèles est leur capacité de raisonnement en chaîne sans supervision directe. Ce principe repose sur l’idée que le raisonnement visible est crucial pour identifier d’éventuels comportements inappropriés. Cela positionne OpenAI comme un acteur soucieux de la sécurité et de l’éthique.

Toutefois, des Limites Persistantes

Malgré ces avancées, OpenAI n’a pas partagé les données d’entraînement, gardant ainsi une partie de son secret. De plus, il est à noter que ces nouveaux modèles n’incluent pas de capacités multimodales, se limitant uniquement à la texte. En effet, les taux d’hallucination de ces modèles sont sensiblement plus élevés que dans leurs versions précédentes, atteignant entre 49% et 53%, contre 16% pour le modèle o1.

Rapport avec l’Environnement Réglementaire

La décision de OpenAI de libérer ces modèles semble être une réponse à la pression croissante, non seulement de ses concurrents, mais aussi d’une évolution réglementaire. La nouvelle administration américaine a encouragé les entreprises à libérer davantage de technologies pour favoriser l’adoption mondiale de l’IA en harmonie avec les valeurs américaines.

Partenariats et Utilisation Pratique

OpenAI a également collaboré avec des partenaires tels qu’Orange, Snowflake, et AI Sweden pour tester l’utilisation des modèles dans des cas réels, cherchant à valider si les avantages d’un modèle ouvert justifient une poursuite des investissements. De plus, ces modèles sont disponibles sous licence Apache 2.0 sur des plateformes telles que Hugging Face, intégrés avec divers outils et services cloud.

Conclusion

Le passage à des modèles ouverts par OpenAI marque un tournant dans l’approche de l’entreprise face à la compétitivité croissante sur le marché de l’intelligence artificielle. En adoptant ce modèle, OpenAI démontre non seulement sa volonté de se maintenir à jour dans un environnement en évolution rapide, mais aussi de favoriser une innovation responsable et accessible. Les implications de cette décision pourraient transformer le paysage de l’IA dans les années à venir, promouvant un écosystème plus collaboratif et innovant.

F1-ES

Son modèle n’est pas seulement puissant et gratuit, mais il a également coûté beaucoup moins cher.

Byteknomers