Les nouveaux modèles d’IA de poche d’Alibaba

Les derniers modèles développés par OpenAI, Anthropic ou Google sont impressionnants, mais ils posent un défi majeur : leur taille gigantesque. Pour les utiliser, il faut se contenter des chatbots proposés par ces entreprises. Cependant, Alibaba vient de réaliser un coup d’éclat en lançant sa nouvelle gamme de modèles de taille réduite, baptisée Qwen 3.5.

Des modèles compacts et performants

La famille Qwen 3.5 se compose de quatre modèles ouverts aux tailles variées : 800 millions (0.8B), 2 milliards (2B), 4 milliards (4B) et 9 milliards (9B) de paramètres. En comparaison, les modèles comme GPT-5.3 ou Gemini 3.1 dépassent probablement les 500 milliards de paramètres, ce qui souligne l’innovation d’Alibaba dans le domaine des modèles compacts.

Des modèles adaptés aux appareils modestes

Les deux premiers modèles de la série Qwen ont été conçus pour le prototypage sur des dispositifs avec des ressources limitées. Leur consommation d’énergie est optimisée, ce qui les rend idéaux pour une utilisation prolongée. Le modèle Qwen3.5-4B ofrece des capacités multimodales, pouvant gérer jusqu’à 262 144 tokens et pesant moins de 3 Go dans sa version 4 bits. Cela permet une utilisation sur des appareils mobiles sans problème.

Un modèle d’intelligence supérieure

Le modèle le plus avancé, Qwen3.5-9B, représente un jalon prometteur. Selon ses concepteurs, il surpasse le modèle d’OpenAI, gpt-oss-120B, qui est 13,5 fois plus volumineux. Tous ces modèles sont accessibles en open source, disponibles tant sur Hugging Face que sur ModelScope.

Statistiques de performance

Une approche nouvelle de l’architecture d’IA

Alibaba a intégré une Architecture Hybride Efficiente en combinant des algorithmes de classement innovants avec le modèle éprouvé Mixture-of-Experts (MoE). Cette méthode aide à surmonter le “mur de mémoire” souvent rencontré dans les modèles de petite taille.

Performances prometteuses en benchmarks

Les résultats des benchmarks sont remarquables. Les modèles Qwen3.5-4B et Qwen3.5-9B démontrent une efficacité accrue, notamment dans les tests multimodaux et de raisonnement. Par exemple, Qwen3.5-9B a surpassé des modèles comme Gemini 2.5 Flash Lite lors d’évaluations de raisonnement visuel.

Des experts comme Paul Couvert ont noté que le modèle Qwen3.5-4B est comparable à des modèles beaucoup plus gros, dépassant ainsi les attentes en matière de performance.

Accessibilité sur divers appareils

Ces modèles sont particulièrement attractifs car ils permettent à n’importe qui de les utiliser sur leur ordinateur portable ou leur smartphone, voire intégrés directement dans un navigateur. Cela signifie que l’on peut bénéficier de ces intelligences artificielles sans connexion, garantissant la confidentialité des conversations.

Un intérêt limité des géants occidentaux

Parmi les grandes entreprises d’IA, Google est la seule à explorer activement les modèles de petite taille, avec son Gemma 3 270M. D’autres, comme Microsoft, ont également développé des modèles comme Phi-4, mais peu de concurrents s’alignent sur l’innovation d’Alibaba. Alors que des startups émergent avec des solutions similaires, Alibaba semble maintenir une avance dans le secteur des modèles d’IA de taille réduite.



F1-ES