{"id":1766013,"date":"2026-05-16T00:37:15","date_gmt":"2026-05-15T21:37:15","guid":{"rendered":"https:\/\/teknomers.com\/fr\/lia-a-bouleverse-une-vieille-regle-des-serveurs-la-memoire-ne-veut-plus-vivre-sur-chaque-machine\/"},"modified":"2026-05-16T00:37:19","modified_gmt":"2026-05-15T21:37:19","slug":"lia-a-bouleverse-une-vieille-regle-des-serveurs-la-memoire-ne-veut-plus-vivre-sur-chaque-machine","status":"publish","type":"post","link":"https:\/\/teknomers.com\/fr\/lia-a-bouleverse-une-vieille-regle-des-serveurs-la-memoire-ne-veut-plus-vivre-sur-chaque-machine\/","title":{"rendered":"L&#8217;IA a boulevers\u00e9 une vieille r\u00e8gle des serveurs : la m\u00e9moire ne veut plus vivre sur chaque machine."},"content":{"rendered":"\n<div>\n<p>## La R\u00e9volution de la M\u00e9moire dans les Centres de Donn\u00e9es<\/p>\n<p>Pour beaucoup, la p\u00e9nurie de m\u00e9moire peut sembler d&#8217;abord un probl\u00e8me li\u00e9 \u00e0 l&#8217;utilisation domestique, avec des modules de RAM devenus de plus en plus rares. Cependant, ce ph\u00e9nom\u00e8ne touche \u00e9galement les grandes entreprises technologiques qui cherchent \u00e0 entra\u00eener et d\u00e9ployer des mod\u00e8les d&#8217;intelligence artificielle (IA) dans les centres de donn\u00e9es. La demande croissante de m\u00e9moire remet en question une r\u00e8gle vieille de plusieurs d\u00e9cennies : chaque machine n&#8217;a pas besoin de d\u00e9pendre uniquement de sa propre RAM.<\/p>\n<p>### La M\u00e9moire Change de Lieu<\/p>\n<p>L&#8217;id\u00e9e de base est de transf\u00e9rer la logique de la m\u00e9moire vers un mod\u00e8le similaire \u00e0 celui du stockage. Actuellement, un fichier peut r\u00e9sider sur un appareil, sur un autre ordinateur du r\u00e9seau ou sur un syst\u00e8me partag\u00e9 accessible par plusieurs serveurs. La prochaine g\u00e9n\u00e9ration de serveurs pourrait adopter une approche similaire pour la RAM : conserver un petit volume local tout en s&#8217;appuyant sur des syst\u00e8mes de m\u00e9moire centrale plus vastes. Ce concept a donn\u00e9 naissance \u00e0 la notion de &#8220;memory godbox&#8221;, un grand cluster de m\u00e9moire non li\u00e9 \u00e0 une seule machine.<\/p>\n<p>### L&#8217;Av\u00e8nement du CXL<\/p>\n<p>Le Compute Express Link (CXL) a lentement gagn\u00e9 en popularit\u00e9, offrant une architecture flexible pour relier processeurs, m\u00e9moire et autres p\u00e9riph\u00e9riques via PCIe. Ce cadre fournit une interface coh\u00e9rente pour une s\u00e9paration des ressources tout en maintenant l&#8217;illusion d&#8217;un fonctionnement unifi\u00e9. Au fur et \u00e0 mesure que la pression sur la m\u00e9moire s&#8217;intensifie, CXL devient de plus en plus pertinent.<\/p>\n<p>#### Une \u00c9volution Progressive<\/p>\n<p>CXL a commenc\u00e9 par permettre l&#8217;extension de la m\u00e9moire des serveurs via des modules connect\u00e9s. Avec CXL 2.0, le concept de &#8220;pooling&#8221; de m\u00e9moire est apparu, permettant de rassembler la m\u00e9moire en un fonds commun pour l&#8217;assigner selon les besoins, bien que sans v\u00e9ritable partage des ressources entre syst\u00e8mes. CXL 3.0 a commenc\u00e9 \u00e0 briser ces limitations, introduisant des topologies plus larges et offrant la possibilit\u00e9 de partager la m\u00e9moire entre diff\u00e9rentes machines, bien qu&#8217;avec certaines contraintes techniques.<\/p>\n<p>### Le Probl\u00e8me Sous-Jacent<\/p>\n<p>La pression exerc\u00e9e par l&#8217;IA ne se limite pas seulement \u00e0 des capacit\u00e9s de calcul. Selon des experts, la m\u00e9moire elle-m\u00eame est souvent un goulot d\u2019\u00e9tranglement. La HBM, qui accompagne les GPU, est rapide mais co\u00fbteuse et limit\u00e9e en capacit\u00e9. La difficult\u00e9 se complique lors de l&#8217;entra\u00eenement de mod\u00e8les avec d&#8217;\u00e9normes ensembles de donn\u00e9es et d&#8217;optimisation pour les requ\u00eates en temps r\u00e9el des utilisateurs.<\/p>\n<p>#### La M\u00e9moire dans le Contexte<\/p>\n<p>Chaque r\u00e9ponse d&#8217;un mod\u00e8le de langage se construit progressivement. Pour \u00e9viter de recalculer des \u00e9l\u00e9ments d\u00e9j\u00e0 trait\u00e9s, ces syst\u00e8mes utilisent une m\u00e9moire de travail, la &#8220;KV cache&#8221;. Cependant, dans des services gag\u00e9s par une forte affluence, cette cache peut rapidement saturer, requ\u00e9rant plus de m\u00e9moire que le mod\u00e8le lui-m\u00eame.<\/p>\n<p>### De la Th\u00e9orie \u00e0 la Pratique<\/p>\n<p>Il ne s&#8217;agit plus d&#8217;une simple th\u00e9orie ou d&#8217;un concept abstrait dans des documents techniques. Des entreprises comme Panmnesia, Liqid, et UnifabriX travaillent d\u00e9j\u00e0 sur des solutions permettant de centraliser la m\u00e9moire en dehors des serveurs, rendant ces ressources accessibles \u00e0 plusieurs machines. Par exemple, Enfabrica propose un syst\u00e8me capable d&#8217;atteindre 18 To de DDR5 par serveur et jusqu&#8217;\u00e0 144 To dans un rack complet. Ainsi, le besoin ne r\u00e9side pas seulement dans l&#8217;augmentation de la m\u00e9moire, mais \u00e9galement dans la fa\u00e7on dont celle-ci est g\u00e9r\u00e9e pour qu&#8217;elle soit pleinement exploit\u00e9e par l\u2019IA.<\/p>\n<\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/teknomers.com\/fr\/category\/finance\/\" rel=\"dofollow\">F1-ES<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>## La R\u00e9volution de la M\u00e9moire dans les Centres de Donn\u00e9es Pour beaucoup, la p\u00e9nurie de m\u00e9moire peut sembler d&#8217;abord un probl\u00e8me li\u00e9 \u00e0 l&#8217;utilisation domestique, avec des modules de RAM devenus de plus en plus rares. Cependant, ce ph\u00e9nom\u00e8ne touche \u00e9galement les grandes entreprises technologiques qui cherchent \u00e0 entra\u00eener et d\u00e9ployer des mod\u00e8les d&#8217;intelligence [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":1766014,"comment_status":"closed","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[6],"tags":[12899,571,133,13717,3970,1406,6848,8541,60,196,1148,16230,3919],"class_list":["post-1766013","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-technologie","tag-bouleverse","tag-chaque","tag-des","tag-lia","tag-machine","tag-memoire","tag-regle","tag-serveurs","tag-sur","tag-une","tag-veut","tag-vieille","tag-vivre"],"_links":{"self":[{"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/posts\/1766013","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/comments?post=1766013"}],"version-history":[{"count":1,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/posts\/1766013\/revisions"}],"predecessor-version":[{"id":1766015,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/posts\/1766013\/revisions\/1766015"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/media\/1766014"}],"wp:attachment":[{"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/media?parent=1766013"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/categories?post=1766013"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/teknomers.com\/fr\/wp-json\/wp\/v2\/tags?post=1766013"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}