La Surconsommation de GPUs dans les Centres de Données

Lorsque la pandémie de COVID-19 a commencé, certains produits, comme le papier toilette et la levure, ont disparu des supermarchés. De même, les géants de la technologie investissent des milliards de dollars dans des GPUs pour l’intelligence artificielle, mais un rapport récent révèle que 95 % de ces unités sont inactives la plupart du temps. Cette situation s’explique en partie par la peur de manquer des opportunités.

Comprendre Kubernetes

Avant d’approfondir ce phénomène, il est crucial d’aborder le concept de Kubernetes. Ce dernier est un système qui gère les ressources dans les centres de données. Imaginez un supermarché où les étagères représentent les serveurs et les produits, les applications. Kubernetes agit comme un chef d’orchestre, s’assurant que tout fonctionne de manière optimisée et en continu.

Inefficacité des Centres de Données

Un rapport de Cast AI sur l’optimisation de Kubernetes a révélé l’ampleur de cette inefficacité. L’analyse de 23,000 clusters chez des géants tels qu’AWS, Azure et GCP a montré que l’utilisation moyenne des GPUs était d’à peine 5 %. Autrement dit, ces entreprises dépensent pour 20 fois plus de capacité de calcul que ce dont elles ont réellement besoin.

Une Situation qui Se Détériore

Les nouvelles ne s’améliorent pas. Les responsables de Cast AI indiquent que la situation se dégrade d’année en année. L’utilisation des CPU a chuté de 10 % à 8 % et celle de la mémoire de 23 % à 20 %. Paradoxalement, malgré cette baisse d’utilisation, les hyperscalers continuent de surcompenser, faisant monter l’approvisionnement des CPU à 69 %.

La Peur de Manquer une Opportunité (FOMO)

La stratégie d’achat agressive des Big Tech est souvent motivée par le FOMO, ou “fear of missing out”. Elles craignent de ne pas être prêtes pour la demande future, entraînant une surenchère sur les ressources. Ce phénomène crée un cycle de pénurie qui impacte non seulement les géants de l’industrie mais également les consommateurs.

Coûts des GPUs Inactives

Le coût des équipements inactifs est non négligeable. Tandis qu’une CPU inoccupée coûte quelques centimes par heure, une GPU inactive peut coûter plusieurs dollars. Cela signifie que les centres de données non seulement perdent de l’argent, mais que les tarifs de location de puissance de calcul sont actuellement en forte augmentation.

Conclusion : Vers un Futur Incertain

Cast AI n’est pas optimiste quant à l’avenir. Les hyperscalers semblent préférer assumer ces coûts plutôt que de modifier leurs habitudes par crainte de ne pas être prêts pour une future montée en flèche de la demande en IA. Cette dynamique amène à se demander si les technologies grand public, comme nos ordinateurs de jeu, auront un avenir, tant que l’accent est mis sur le matériel dédié à l’IA.


À travers cette analyse, nous voyons que la surconsommation des GPUs et l’inefficacité des centres de données posent des défis majeurs pour le secteur technologique. Les conséquences de cette dynamique se font sentir bien au-delà des simples coûts financiers.



F1-ES