Musk prévoit de décupler le supercalculateur Colossus AI


Débloquez gratuitement Editor’s Digest

La start-up d’intelligence artificielle d’Elon Musk, xAI, s’est engagée à décupler la taille de son supercalculateur Colossus pour y intégrer plus d’un million d’unités de traitement graphique, dans le but de devancer ses concurrents tels que Google, OpenAI et Anthropic.

Colossus, construit en seulement trois mois plus tôt cette année, est considéré comme le plus grand supercalculateur au monde, exploitant un cluster de plus de 100 000 GPU Nvidia interconnectés. Les puces sont utilisées pour former le chatbot Grok de Musk, qui est moins avancé et compte moins d’utilisateurs que ChatGPT, leader du marché, ou Gemini de Google.

Les travaux ont déjà commencé pour augmenter la taille de l’installation à Memphis, Tennessee, selon un communiqué publié mercredi par la Chambre du Grand Memphis. Nvidia, Dell et Supermicro Computer établiraient également des opérations à Memphis pour soutenir l’expansion, a indiqué la chambre de commerce, tout en créant une « équipe d’opérations spéciales xAI » pour « fournir un service de conciergerie 24 heures sur 24 à l’entreprise ».

Le coût d’acquisition d’autant de GPU serait important. La dernière génération de GPU Nvidia coûte généralement des dizaines de milliers de dollars, bien que les anciennes versions des puces puissent être moins chères. L’expansion prévue de Colossus par Musk nécessiterait un investissement susceptible d’atteindre des dizaines de milliards de dollars, sans compter le coût élevé de construction, d’alimentation et de refroidissement des vastes serveurs dans lesquels ils seraient installés. xAI a levé environ 11 milliards de dollars de capital auprès d’investisseurs cette année.

Les entreprises d’IA s’efforcent de sécuriser les GPU et l’accès aux centres de données afin de fournir la puissance de calcul nécessaire à la formation et à l’exécution de leurs modèles pionniers en langages étendus.

OpenAI, le fabricant de ChatGPT, a un partenariat de près de 14 milliards de dollars avec Microsoft qui comprend des crédits pour la puissance de calcul. Anthropic, le fabricant du chatbot Claude, a reçu 8 milliards de dollars d’investissement d’Amazon et le sera bientôt accès donné à un nouveau cluster de plus de 100 000 de ses puces spécialisées en IA.

Plutôt que de former des partenariats, Musk, l’homme le plus riche du monde, a utilisé son pouvoir et son influence au sein du secteur technologique pour développer sa propre capacité de calcul intensif, même s’il est en train de rattraper son retard après avoir fondé xAI il y a à peine plus d’un an. La trajectoire a été abrupte : la start-up est évaluée à 45 milliards de dollars et a récemment levé 5 milliards de dollars supplémentaires.

Musk est en concurrence féroce avec OpenAI, qu’il a contribué à cofonder avec Sam Altman, entre autres, en 2015. Les deux hommes se sont ensuite brouillés et Musk poursuit désormais OpenAI, cherchant à bloquer sa transition d’une entreprise à but non lucratif à une entreprise plus traditionnelle.

Un investisseur dans xAI a déclaré que la rapidité avec laquelle Musk avait créé Colossus était la « plume dans le chapeau » de la société d’IA, malgré son offre de produits commerciaux limitée. “Il a construit le supercalculateur le plus puissant du monde en trois mois.”

Jensen Huang, directeur général de Nvidia, a déclaré en octobre qu’« il n’y avait qu’une seule personne au monde qui pouvait faire cela ». Huang a qualifié Colossus de « facilement le supercalculateur le plus rapide de la planète en tant que cluster », et a déclaré qu’un centre de données de cette taille prendrait généralement trois ans à construire.

Le projet Colossus a suscité la controverse en raison de la rapidité avec laquelle il a été construit. Certains l’ont accusé de contourner les autorisations de construire et ont critiqué les exigences qu’il impose au réseau électrique de la région.

« Nous ne nous contentons pas de diriger depuis le front ; nous accélérons les progrès à un rythme sans précédent tout en garantissant la stabilité du réseau grâce à la technologie mégapack », a déclaré Brent Mayo, directeur principal de xAI pour la construction de sites et l’infrastructure, lors d’un événement à Memphis, selon le communiqué.



ttn-fr-56