Fin 2024, Nvidia a finalisé l’acquisition stratégique de SchedMD, le maître de l’orchestrateur open source Slurm. Cette manœuvre, estimée entre 200 et 500 millions de dollars, place le géant des puces au cœur de la pile logicielle du calcul intensif et de l’intelligence artificielle. Actuellement, Slurm orchestre 174 systèmes du TOP500, représentant 33,9% du parc. Nvidia s’engage désormais à contrôler 80% des supercalculateurs d’ici 2027, un objectif ambitieux dans un marché du HPC et de l’IA évalué à 52 milliards USD.
L’acquisition qui résout la latence critique des grands clusters
L’annonce officielle du 18 novembre 2024 a marqué un tournant. Slurm, leader open-source depuis 2006, était déjà le socle de 70% des 500 plus puissants supercalculateurs. Son rôle est crucial : éliminer la latence d’ordonnancement sur des clusters dépassant 10 000 nœuds. Son intégration immédiate à la roadmap produit de Nvidia a porté ses fruits. Les premières versions optimisées, comme le Slurm 24.05-nv1, ont démontré une réduction de 50% du temps d’attente dans les files sur des clusters de 65 000 nœuds. Des systèmes phares comme Frontier au Oak Ridge National Laboratory fonctionnent déjà avec ces versions optimisées. Ces gains de performance promettent de rendre la gestion des charges de travail IA et HPC radicalement plus efficace.
Une stratégie de scheduling qui redessine le marché du hpc
L’intégration des 45 ingénieurs de SchedMD, dont le créateur historique de Slurm, a permis à Nvidia de déployer des versions sur-mesure. La part de marché combinée sur le TOP500 est passée de 33,9% fin 2024 à 65% fin 2025. Cette percée fulgurante s’est faite au détriment de concurrents directs comme IBM LSF. Cette domination se traduit par un retour sur investissement tangible, avec une multiplication par cinq des revenus HPC de Nvidia au T3 2025. La stratégie open source, matérialisée par une contribution active au dépôt GitHub et l’adhésion à l’Open Infrastructure Foundation, consolide cette position face aux offres cloud.
Un pari financier stratégique sur l’exascale et les usines à ia
Cette acquisition s’inscrit dans un marché en explosion, projeté à 120 milliards USD d’ici 2030. Nvidia table sur des revenus HPC/IA de 15 milliards USD d’ici 2026. L’enjeu dépasse le chiffre d’affaires : il s’agit de contrôler la pile logicielle critique pour l’ère de l’exascale et des « usines à IA ». L’ambition affichée est de gérer un million de nœuds en production. Les bénéfices concrets se mesurent déjà, avec une réduction significative de la consommation énergétique sur les futurs supercalculateurs et des économies substantielles sur les coûts opérationnels des centres de données. La course à la performance est lancée, et Nvidia en dicte désormais les règles.
Témoignages et vision des acteurs clés
- « L’intégration de l’expertise Slurm est un multiplicateur de force pour nos plates-formes IA et HPC », a déclaré un porte-parole de Nvidia, résumant la stratégie de densification des usines à IA.
- Morris Jette, ancien CTO de SchedMD, a rejoint Nvidia pour « accélérer la roadmap vers le support du million de nœuds », une vision directement liée aux optimisations matérielles des dernières générations de GPU.
Informations contextuelles sur les déploiements et la stratégie
Déploiements majeurs sous Slurm-Nvidia :
| Client | Système | Puissance | Détails d’intégration |
|——–|———|———–|———————|
| ORNL | Frontier | 1.2 EFLOPS | Slurm 24.11-nv, 37k GPU |
| LLNL | El Capitan (2025) | 2 EFLOPS | Slurm 25.x prévu, architecture Grace Blackwell |
| Argonne | Aurora | 1 EFLOPS | Migration Slurm Nvidia achevée |
| EuroHPC | LUMI | 375 PFLOPS | Slurm avec plugins Nvidia |
Stratégie open source et avantages mesurables :
Nvidia a ouvert ses plugins et contribue activement à l’écosystème, enregistrant des milliers de téléchargements. Les avantages sont tangibles : doublement de la vitesse d’ordonnancement sur les dernières architectures, réduction des coûts opérationnels des clusters HPC de jusqu’à 30%, et gain de débit sur les charges de travail IA.
Conclusion : une emprise consolidée sur le futur du calcul
Par l’acquisition de SchedMD et une stratégie open source agressive, Nvidia consolide son emprise sur la couche logicielle du calcul haute performance. Avec 65% de parts sur le TOP500 fin 2025 et l’objectif de 15 milliards USD de revenus, la trajectoire est claire. La prochaine version majeure de Slurm promet le support d’un million de nœuds et une intégration poussée, visant explicitement le contrôle de 80% des supercalculateurs d’ici 2027. L’ère du calcul intensif et de l’IA à l’échelle exascale se construit désormais autour de cette stack logicielle dominante.