Les avancées d’Alibaba dans le domaine de l’IA

Alibaba a récemment dévoilé son nouveau modèle, le Qwen3.6-27B, qui offre des performances impressionnantes tout en étant significativement plus compact que son prédécesseur, le Qwen3.5-397B-A17B. Alors que ce dernier contenait 397 milliards de paramètres et pesait 807 Go, le nouveau modèle ne pèse même pas 17 Go. Cela remet en question l’idée selon laquelle la taille est directement proportionnelle à la performance.

Un modèle dense

La plupart des modèles IA contemporains exercent l’architecture Mixture-of-Experts (MoE). Cela signifie qu’ils possèdent un grand nombre de paramètres, mais n’en activent qu’une fraction lors de leur utilisation. Par exemple, le Qwen3.5-397B-A17B activait seulement 17 milliards de ses 397 milliards de paramètres.

En revanche, le Qwen3.6-27B présente un modèle dense où tous ses 27 milliards de paramètres sont actifs à chaque inférence. Bien que cela puisse sembler moins efficace, cette approche offre plusieurs avantages pratiques, comme une configuration simplifiée et une quantification plus concise.

Performance comparée

Des benchmarks, tels que SWE-bench Verified, démontrent que le Qwen3.6-27B a obtenu un score de 77,2%, surpassant ainsi les 76,2% du modèle de 397 milliards de paramètres. De plus, dans le Test Terminal-Bench 2.0, le Qwen3.6 a atteint 59,3%, contre seulement 2,5% pour son prédécesseur. Ce modèle open-source égalise même les performances d’autres modèles prestigieux, comme le Claude Opus 4.5.

Un repositionnement stratégique d’Alibaba

Ce qui est particulièrement intriguant, c’est qu’Alibaba elle-même promeut le Qwen3.6-27B, reconnaissant qu’il est plus puissant que son modèle précédent. Cela signale un changement de paradigme important dans la conception des modèles IA: les géants du secteur commencent à comprendre que la taille ne fait pas tout.

Accessibilité du modèle

Avec seulement 24 Go de VRAM nécessaires pour fonctionner, le Qwen3.6-27B est accessible à un plus large public. Les cartes graphiques comme la RTX 3090 peuvent fonctionner de manière efficace avec ce modèle, ouvrant la porte à davantage d’utilisateurs désirant se pencher sur des fonctionnalités de traitement local tout en préservant leur vie privée.

L’émergence des modèles plus petits

Alibaba n’est pas le seul acteur à révolutionner le secteur des modèles IA compacts. D’autres entreprises comme Google et Microsoft travaillent également sur des modèles de petite taille, tels que Gemma 4 et Phi-4, respectivement. L’intérêt croissant pour les Small Language Models (SLMs) indique une évolution vers des solutions plus tournées vers l’utilisateur, sans sacrifier la performance.

Conclusion : une dynamique en mutation

Bien que le Qwen3.6-27B semble très prometteur et compétitif, il est essentiel de garder à l’esprit que ces modèles restent à un certain niveau derrière ceux des leaders du marché comme Anthropic, OpenAI, ou Google. En effet, les modèles chinois pourraient encore avoir un retard de 6 à 12 mois sur leurs homologues les plus avancés. L’infrastructure et l’investissement demeurent cruciaux pour accéder à la vitesse et la performance optimales, même si les solutions locales commencent à attirer davantage d’attention.



F1-ES