Le Département américain de l’énergie (DOE) et AMD collaborent sur deux nouveaux supercalculateurs d’IA au Laboratoire national d’Oak Ridge (ORNL) dans le cadre d’une stratégie d’IA plus vaste visant à faire progresser la recherche dans les domaines de la science, de l’énergie et de la sécurité nationale et à renforcer la position du pays dans le calcul haute performance.
Les deux machines représentent environ 1 milliard de dollars d’investissements publics et privés. Une fois terminés, ils feront partie d’un réseau informatique national sécurisé conçu pour soutenir la recherche sur l’IA en utilisant une infrastructure basée sur des normes construite aux États-Unis. Le projet reflète la manière dont une stratégie coordonnée d’IA peut aligner les objectifs nationaux en matière d’innovation, d’efficacité énergétique et de gouvernance des données.
Le Dr Lisa Su, présidente et PDG d’AMD, a déclaré que la société est « fière et honorée de s’associer au ministère de l’Énergie et au laboratoire national d’Oak Ridge pour accélérer les fondations américaines de la science et de l’innovation ». Elle a ajouté que les systèmes « exploiteront les technologies informatiques hautes performances et d’IA d’AMD pour faire progresser les priorités de recherche américaines les plus critiques dans les domaines de la science, de l’énergie et de la médecine ».
Lux AI : former la prochaine vague de modèles d’IA
Prévue pour être opérationnelle début 2026, Lux AI sera la première « AI Factory » du pays – une installation construite pour former et déployer des modèles d’IA avancés pour la science, l’énergie et la sécurité. Le système est développé avec ORNL, AMD, Oracle Cloud Infrastructure et Hewlett Packard Enterprise.
Lux utilisera les GPU AMD Instinct MI355X, les processeurs EPYC et le réseau Pensando pour gérer les tâches d’IA gourmandes en données. Il est conçu pour accélérer la recherche dans des domaines tels que les systèmes énergétiques, les matériaux et la médecine. L’architecture du système permet à plusieurs groupes de travailler ensemble tout en gardant les données sécurisées et séparées, un modèle qui reflète le nombre de grandes organisations qui commencent à gérer des charges de travail sensibles d’IA.
Découverte : renforcer la stratégie américaine en matière d’IA et de supercalcul
Le système Discovery suivra en 2028 et deviendra le prochain supercalculateur phare du DOE à Oak Ridge. Il utilisera les prochains processeurs EPYC « Venice » d’AMD et les GPU MI430X, qui font partie d’une nouvelle série conçue pour l’IA et le calcul scientifique.
La conception « Bandwidth Everywhere » de Discovery augmente la mémoire et les performances du réseau sans consommer plus d’énergie. Cela signifie qu’il peut traiter davantage de données et exécuter efficacement des modèles complexes tout en maintenant les coûts énergétiques – un défi auquel de nombreux grands centres de données sont également confrontés aujourd’hui.
Le système s’appuie sur les enseignements tirés de Frontier, le premier ordinateur exascale au monde, garantissant que les applications existantes peuvent facilement migrer vers la nouvelle plate-forme.
Le secrétaire américain à l’Énergie, Chris Wright, a déclaré : « Gagner la course à l’IA nécessite des partenariats nouveaux et créatifs qui rassembleront les esprits et les industries les plus brillants que la technologie et la science américaines ont à offrir. » Il a déclaré que les nouveaux systèmes démontrent « une approche sensée des partenariats informatiques » qui renforcent le pays grâce à l’innovation partagée.
Le directeur de l’ORNL, Stephen Streiffer, a déclaré que Discovery « stimulera l’innovation scientifique plus rapidement et plus loin que jamais », ajoutant que la combinaison du calcul haute performance et de l’IA peut réduire le délai entre les problèmes de recherche et les solutions du monde réel.
Des partenariats qui stimulent l’innovation en IA et la stratégie à long terme
AMD, HPE et Oracle jouent chacun un rôle clé dans la construction et le support des systèmes. Antonio Neri, président et PDG de HPE, a déclaré que cette collaboration aidera Oak Ridge à atteindre « une productivité et une évolutivité sans précédent ». Le vice-président exécutif d’Oracle, Mahesh Thiagarajan, a déclaré que la société travaillait avec le DOE pour « fournir une infrastructure d’IA souveraine et performante qui soutiendra le co-développement du cluster Lux AI ».
Une fois opérationnels, Lux et Discovery aideront le DOE à exécuter des modèles d’IA à grande échelle pour améliorer la compréhension dans les domaines de l’énergie, de la biologie, de la science des matériaux et de la défense nationale. Discovery aidera également à concevoir des batteries, des réacteurs, des semi-conducteurs et des matériaux critiques de nouvelle génération.
Ce que cela signifie pour les dirigeants d’entreprise
Pour les organisations, ces systèmes mettent en évidence la manière dont la stratégie d’IA et le HPC peuvent permettre une recherche plus rapide, une efficacité améliorée et une gestion sécurisée des données. Ils montrent également que les gains de performances ne doivent pas nécessairement se faire au prix d’une consommation d’énergie plus élevée.
Les partenariats du DOE avec les fournisseurs de technologies reflètent un modèle que les entreprises privées peuvent suivre : combiner l’expertise de tous les secteurs pour développer une infrastructure partagée tout en maintenant le contrôle des données. À mesure que les charges de travail de l’IA augmentent, les organisations publiques et privées devront créer des systèmes qui équilibrent puissance, performances et gouvernance.
Les projets Lux et Discovery montrent à quoi pourrait ressembler cet équilibre dans la pratique : ouvert, collaboratif et conçu pour soutenir la découverte à grande échelle – une leçon sur la manière dont une stratégie d’IA avant-gardiste peut transformer l’infrastructure en un avantage concurrentiel à long terme.
(Photo de Syed Ali)