Restez informé avec des mises à jour gratuites

Les rivaux de Nvidia se mobilisent pour tenter de briser l’emprise de l’entreprise sur le marché des puces d’IA, en levant des centaines de millions de dollars et en lançant de nouveaux produits alors qu’ils cherchent à partager le butin d’un boom de la technologie de l’intelligence artificielle.

Cerebras, d-Matrix et Groq font partie d’un groupe de petites entreprises qui visent à prendre une part du marché des puces d’IA de plusieurs milliards de dollars à Nvidia, qui a jusqu’à présent dominé la première vague d’investissement avec ses unités de traitement graphique, ou GPU.

Ils surfent sur la vague de l’espoir selon lequel la demande en « inférence » d’intelligence artificielle — la puissance de calcul nécessaire à des modèles tels que ChatGPT d’OpenAI et Gemini de Google pour générer des réponses aux requêtes — va croître de manière exponentielle à mesure que les chatbots et autres applications d’IA générative deviendront plus populaires.

Les GPU Hopper de Nvidia, parfaitement adaptés à la tâche très gourmande en ressources consistant à former les meilleurs modèles d’IA, sont devenus l’un des produits les plus en vogue au monde.

Cerebras, d-Matrix et Groq se concentrent plutôt sur des puces moins chères et plus spécialisées, conçues pour exécuter des modèles d’IA.

Cerebras a annoncé mardi sa nouvelle plateforme « Cerebras Inference », basée sur sa puce CS-3, qui fait la taille d’une assiette à dîner. Cerebras affirme que sa solution est 20 fois plus rapide que la génération actuelle de puces Hopper de Nvidia en matière d’inférence IA, pour une fraction du prix. Cerebras cite des tests réalisés par le fournisseur d’analyses comparatives Artificial Analysis.

« Pour vaincre le gorille de 363 kg, il faut proposer un produit bien meilleur sur le marché », a déclaré Andrew Feldman, directeur général de Cerebras, au Financial Times. « D’après mon expérience, les meilleurs produits gagnent généralement, et nous avons conquis des clients importants grâce à [Nvidia].”

La puce CS-3 évite l’utilisation d’une puce mémoire séparée à large bande passante, comme celle utilisée par Nvidia. Elle propose à la place une architecture alternative avec mémoire intégrée directement dans la plaquette de la puce.

Selon Feldman, les limites de la bande passante mémoire constituent une contrainte fondamentale pour la vitesse d’inférence d’une puce d’IA. La combinaison de la logique et de la mémoire dans une seule grande puce produit des résultats « d’un ordre de grandeur plus rapides », a-t-il déclaré.

d-Matrix, fondée par Sid Sheth en 2019, lance également un nouveau tour de financement moins d’un an après avoir levé 110 millions de dollars lors d’un tour de financement de série B mené par le fonds public singapourien Temasek. La société vise à lever 200 millions de dollars ou plus plus tard cette année ou au début de l’année prochaine, selon Sheth. d-Matrix en est au début du processus de levée de fonds et a déclaré que le chiffre final levé pourrait changer.

d-Matrix prévoit de lancer à grande échelle sa propre plateforme de puces, Corsair, à la fin de cette année. Sheth a déclaré que la société associait ses produits à des logiciels ouverts tels que Triton, qui concurrence Cuda de Nvidia, une plateforme logicielle largement utilisée qui offre aux développeurs les outils nécessaires pour créer des applications d’IA et optimise les performances de ses puces.

Les plus gros clients de Nvidia soutiennent l’utilisation de logiciels libres comme Triton. « Les développeurs d’applications n’aiment pas être limités à un outil particulier », a déclaré Sheth, et « les gens commencent à comprendre que Nvidia a la mainmise sur Cuda en matière de formation ».

Groq, un autre concurrent de l’inférence IA dirigé par un ancien membre fondateur de l’équipe de l’unité de traitement des tenseurs de Google, a levé 640 millions de dollars ce mois-ci auprès d’investisseurs dirigés par BlackRock Private Equity Partners, pour une valorisation de 2,8 milliards de dollars.

Un investisseur en capital-risque a averti que malgré le battage médiatique autour du secteur, les start-ups de semi-conducteurs avaient eu du mal à percer sur le marché.

Le fabricant de puces Graphcore a été acheté par SoftBank le mois dernier pour un peu plus de 600 millions de dollars, soit moins que les quelque 700 millions de dollars que la société avait levés en capital-risque depuis sa création en 2016, selon des personnes au courant de l’accord.

Groq et Cerebras ont également été fondées en 2016. « Les investisseurs publics ont un désir quasi insatiable de trouver et de soutenir le prochain Nvidia », a déclaré Peter Hébert, cofondateur et associé directeur de la société de capital-risque Lux Capital. « Il ne s’agit pas seulement de suivre la dernière tendance. Cette dynamique profite également à plusieurs start-ups de puces électroniques financées par du capital-risque qui peinent depuis près d’une décennie. »

Vidéo : L’IA : une bénédiction ou une malédiction pour l’humanité ? | FT Tech



ttn-fr-56