Nvidia a officialisé le 18 décembre 2024 le rachat de SchedMD, l’éditeur du logiciel de gestion de charge Slurm, qui équipe 60% des superordinateurs du Top500. Cette manœuvre stratégique cherche à résoudre le goulot d’étranglement majeur des « usines à IA » : orchestrer efficacement des dizaines de milliers de GPU. Alors que la course à l’intelligence artificielle exige une puissance de calcul toujours plus colossale, comment Nvidia verrouille-t-elle l’infrastructure logicielle critique ? En s’emparant de l’outil standard, Slurm, déjà au cœur des plus grands systèmes comme Frontier à Oak Ridge, le géant des puces contrôle désormais la pile technologique de bout en bout. Cette consolidation du marché du calcul haute performance est un coup de maître.
Les détails concrets de l’acquisition de schedmd
Le montant de la transaction n’a pas été divulgué. Fondée en 2006 à Livermore, SchedMD compte plus de 150 employés et sert plus de 1000 organisations mondiales. Sa clientèle inclut des acteurs majeurs de la recherche et de l’industrie, démontrant l’emprise du logiciel d’orchestration sur l’écosystème :
- Laboratoires publics : Les installations du Department of Energy (DOE) comme Oak Ridge (Frontier, #1 Top500) et Argonne (Aurora, #2), ainsi que le CERN et la NASA.
- Géants de la tech : Des entreprises comme Meta, OpenAI et xAI, via leurs clusters basés sur des systèmes Nvidia DGX.
L’échelle de Slurm est monumentale. Selon SchedMD, le logiciel gère des milliards de jobs par jour au sein de l’écosystème global et peut supporter des clusters de plus d’un million de nœuds. Plus de 100 ingénieurs HPC de Nvidia vont rejoindre les équipes de SchedMD pour accélérer l’intégration, renforçant ainsi la domination technologique du groupe.
Une pile logicielle unifiée pour l’ia : l’objectif stratégique
Cette acquisition s’efforce d’intégrer nativement Slurm, un logiciel open-source sous licence GPL, à l’écosystème matériel et logiciel de Nvidia. L’intégration cherche spécifiquement à optimiser la gestion des ressources dans trois domaines clés :
- La plateforme DGX SuperPOD : Pour optimiser le scaling au-delà de 10 000 GPU, un défi actuel pour les charges de travail d’IA massives.
- La pile logicielle CUDA : Une intégration profonde avec les bibliothèques NCCL et cuDNN doit permettre d’éliminer les goulots de communication et d’accélérer l’exécution des jobs.
- Les futures architectures : Comme le superchip Grace Hopper, conçu pour le HPC et l’IA.
Slurm, dans sa version 24.11 actuelle, est déjà « GPU-aware » et supporte nativement les charges de travail d’intelligence artificielle. Nvidia a l’intention d’en faire le scheduler par défaut de ses « AI factories », verrouillant ainsi le système de gestion de jobs.
La stratégie d’investissement agressive de nvidia en contexte
Cette opération s’inscrit dans une stratégie d’investissement agressive et cohérente de Nvidia pour dominer la couche logicielle du HPC. Depuis 2020, le géant a dépensé plus de 8 milliards de dollars en acquisitions ciblées, construisant méthodiquement son écosystème propriétaire :
| Acquisition/Investissement | Date | Montant (estimé) | Objectif |
|---|---|---|---|
| Mellanox | 2020 | 6,9 Md$ | Réseaux InfiniBand/Ethernet haute performance |
| Run:ai | Avril 2024 | 700 M$ | Orchestration Kubernetes pour GPU |
| SchedMD | Décembre 2024 | Non divulgué | Scheduling de jobs HPC/IA (Slurm) |
Cette verticalisation est soutenue par une domination matérielle écrasante : Nvidia équipe 80 à 90% des GPU présents dans le Top500, avec 172 systèmes l’utilisant directement. Ses revenus Data Center, portés par cette demande, ont atteint 47,5 milliards de dollars au troisième trimestre de l’exercice 2025.
La vision du pdg : construire les usines à ia de demain
Jensen Huang, PDG de Nvidia, résume l’ambition : « L’acquisition de SchedMD accélérera l’innovation en IA et en calcul haute performance sur des GPU accélérés. L’intégration de Slurm dans notre plateforme est une étape clé pour construire les usines à IA de nouvelle génération. » Cette déclaration souligne la volonté de contrôler toute la chaîne de valeur.
Conséquences et projections pour l’écosystème hpc
Cette consolidation place Nvidia dans une position de contrôle sans précédent sur la pile technologique des supercalculateurs, du silicium au logiciel de scheduling. Les conséquences pour le marché de l’infrastructure IA sont immédiates :
- Pour la concurrence : Les solutions alternatives comme IBM LSF ou Altair PBS Pro, qui se partagent moins de 20% du marché du scheduling HPC, font face à un acteur intégré verticalement et extrêmement puissant.
- Pour l’open-source : Bien que Slurm reste sous licence GPL, le contrôle de son développement principal par Nvidia pourrait orienter sa roadmap prioritairement vers l’optimisation pour les technologies du géant, au détriment d’une neutralité perçue.
- Projections financières : Selon les analyses de marché, cette acquisition pourrait générer des synergies de coût de 100 à 200 millions de dollars par an. La valorisation de SchedMD avant le rachat était estimée entre 500 et 800 millions de dollars par des analystes financiers. Aucun obstacle réglementaire antitrust n’est attendu, la transaction étant estimée en dessous du seuil d’inquiétude.
L’intégration technique complète au sein de la plateforme Nvidia est prévue pour le premier trimestre 2025. En s’emparant de l’outil d’orchestration standard des supercalculateurs, Nvidia ne se contente pas de renforcer son écosystème : elle verrouille l’infrastructure logicielle critique de la prochaine décennie de l’intelligence artificielle. Surveillez la prochaine version majeure de Slurm ; elle portera certainement la marque indélébile des usines à IA de Nvidia.