www.industrieweb.fr

Infrastructures de data centers IA à l’échelle du gigawatt

Schneider Electric collabore avec NVIDIA pour développer des architectures de référence combinant distribution électrique, refroidissement et jumeaux numériques pour les data centers IA.

  www.se.com
Infrastructures de data centers IA à l’échelle du gigawatt

Les centres de données dédiés à l’intelligence artificielle imposent de nouvelles contraintes en matière de densité de puissance, de capacité de refroidissement et de gestion opérationnelle, à mesure que les clusters GPU atteignent des niveaux de consommation proches du gigawatt. Pour répondre à ces exigences d’infrastructure, Schneider Electric a présenté de nouvelles architectures de référence et des outils d’ingénierie pour les data centers IA de grande échelle, développés en collaboration avec NVIDIA et AVEVA.

Ces développements ont été présentés lors de la conférence NVIDIA GTC à San Jose, avec un accent particulier sur la conception des infrastructures, la simulation sur l’ensemble du cycle de vie et les opérations autonomes pour les environnements de calcul haute performance.

Architecture de référence pour la distribution électrique et la gestion thermique
L’architecture de référence NVIDIA Vera Rubin développée avec Schneider Electric se concentre sur l’alimentation électrique et l’intégration du refroidissement pour les systèmes rack-scale NVIDIA, notamment la plateforme Vera Rubin NVL72.

La conception introduit une architecture de distribution électrique en 480 VAC destinée à supporter des densités de racks plus élevées. Du point de vue thermique, elle permet des températures d’alimentation des boucles de refroidissement atteignant 45 °C, afin d’améliorer l’efficacité des systèmes de refroidissement sous fortes charges de calcul.

L’architecture permet également le déploiement de clusters de racks IA dans lesquels les ressources réseau, de stockage, les CPU et les équipements de support sont mutualisés, tandis que les racks GPU fonctionnent avec des tensions dédiées plus élevées. Cette approche facilite la montée en puissance des clusters GPU tout en maintenant l’efficacité énergétique et la proximité physique des ressources de calcul.

La conception de l’infrastructure prend également en compte les profils de fonctionnement des GPU tels que MaxP et MaxQ. La configuration MaxQ vise à améliorer le nombre de tokens générés par watt, un indicateur pertinent pour l’efficacité énergétique des calculs IA et l’optimisation énergétique des data centers.

La validation des systèmes électriques a été réalisée à l’aide des outils de modélisation ETAP, tandis que le comportement thermique et les flux d’air ont été analysés à l’aide de simulations CFD (Computational Fluid Dynamics) ITD.

Jumeaux numériques pour l’ingénierie des infrastructures IA
AVEVA, la filiale logicielle industrielle de Schneider Electric, a collaboré avec NVIDIA pour développer une architecture de jumeau numérique couvrant l’ensemble du cycle de vie des infrastructures IA, en s’appuyant sur l’environnement NVIDIA Omniverse DSX Blueprint. L’objectif est de soutenir la validation des conceptions et les processus d’ingénierie des grandes infrastructures IA grâce à la simulation.

Cette architecture intègre les logiciels d’ingénierie et d’exploitation d’AVEVA dans l’écosystème Omniverse, permettant des simulations multi-domaines couvrant la distribution électrique, les phénomènes thermodynamiques, la circulation d’air et les systèmes de contrôle.

Une fois les architectures systèmes définies dans l’environnement numérique, ces simulations permettent de tester les performances dans différentes conditions de charge et d’environnement. Cette approche permet l’optimisation des conceptions par itérations, l’évaluation rapide de différents scénarios et la vérification des systèmes avant leur construction physique.

Cette méthodologie vise à réduire les cycles d’ingénierie, améliorer la précision du déploiement et optimiser les performances des infrastructures. L’ingénierie basée sur les jumeaux numériques s’inscrit dans l’évolution des stratégies de digital supply chain et de planification des infrastructures basées sur des modèles.

IA agentique pour la gestion des alarmes des data centers
Schneider Electric a également annoncé des essais du modèle ouvert NVIDIA Nemotron pour prendre en charge des fonctions de gestion des alarmes basées sur des approches d’IA agentique dans l’exploitation des data centers.

L’approche testée repose sur l’analyse des alarmes au niveau des systèmes à partir de données IoT collectées en temps réel depuis différents sous-systèmes d’infrastructure. Le logiciel analyse les événements, identifie les causes probables et propose des actions correctives via des outils de diagnostic intégrés.

Ce système vise à assister les équipes de maintenance en améliorant la cohérence de l’interprétation des alarmes, en réduisant les interventions inutiles et en accélérant la résolution des incidents d’infrastructure. Ce type de gestion des performances des actifs assistée par IA illustre l’évolution vers des opérations de data centers davantage pilotées par logiciel.

Édité par la journaliste industrielle Aishwarya Mambet, avec assistance de l’IA.

www.se.com

  Demander plus d’information…

LinkedIn
Pinterest

Rejoignez nos 155 000 followers (pour IMP)