La percée du matériel de l’IA de Huawei remet en question la domination de Nvidia

Le géant chinois de la technologie Huawei a fait une décision audacieuse qui pourrait potentiellement changer qui dirige la course mondiale sur les puces AI. La société a dévoilé un nouveau système informatique puissant appelé CloudMatrix 384 Supernode qui, selon les rapports des médias locaux, fonctionne mieux que la technologie similaire du leader américain Nvidia.

Si les revendications de performance s’avèrent exactes, la percée du matériel d’IA pourrait remodeler le paysage technologique à un moment où le développement de l’IA se poursuit dans le monde entier, et malgré les efforts américains pour limiter l’accès de la Chine à la technologie avancée.

300 Petaflops: défier la domination matérielle de Nvidia

Le supernode CloudMatrix 384 est décrit comme un «produit au niveau nucléaire», selon les rapports de Star Market Daily cité par le Post du matin du sud de la Chine (SCMP). Le matériel atteint un impressionnant 300 Petaflops de puissance de calcul, en plus des 180 Petaflops livrés par le système NVL72 de NVIDIA.

Le supernode CloudMatrix 384 a été spécifiquement conçu pour aborder les goulots d’étranglement informatiques qui sont devenus de plus en plus problématiques car les modèles d’intelligence artificielle continuent de croître en taille et en complexité.

Le système est conçu pour rivaliser directement avec les offres de Nvidia, qui ont dominé le marché mondial du matériel d’accélérateur d’IA jusqu’à présent. L’infrastructure CloudMatrix de Huawei a été dévoilée pour la première fois en septembre 2024 et a été développée spécifiquement pour répondre à la demande croissante du marché intérieur de la Chine.

La variante de supernode 384 représente la mise en œuvre la plus puissante de l’architecture d’IA à ce jour, avec des rapports indiquant qu’il peut atteindre un débit de 1 920 jetons par seconde et maintenir des niveaux de précision élevés, correspondait apparemment aux performances des puces H100 de NVIDIA, mais à l’aide de composants de fabrication chinoise à la place.

Développer sous sanctions: la réussite technique

Ce qui rend la percée matérielle de l’IA particulièrement importante, c’est qu’elle a été réalisée malgré les restrictions technologiques sévères que Huawei a été confrontées depuis sa place sur la liste des entités américaines.

Les sanctions ont limité l’accès de l’entreprise à la technologie et aux logiciels de conception avancés des semi-conducteurs américains, forçant Huawei à développer des approches alternatives et à s’appuyer sur des chaînes d’approvisionnement intérieures.

L’avancement technologique de base permettant les performances du CloudMatrix 384 semble être la réponse de Huawei à NVIDIA NVLINK – une technologie d’interconnexion à grande vitesse qui permet à plusieurs GPU de communiquer efficacement.

Le système NVL72 de NVIDIA, sorti en mars 2024, dispose d’un domaine NVLink 72-GPU qui fonctionne comme un GPU unique et puissant, permettant une inférence en temps réel pour les modèles de paramètre d’un trillion à des vitesses 30 fois plus rapides que les générations précédentes.

Selon les rapports du SCCPHuawei collabore avec SiliconFlow de la startup d’infrastructure d’IA chinoise pour implémenter le supernode CloudMatrix 384 pour soutenir Deepseek-R1, un modèle de raisonnement de Deepseek basé à Hangzhou.

Les supernodes sont des architectures d’infrastructure d’IA équipées de plus de ressources que de systèmes standard – y compris des unités de traitement centrales améliorées, des unités de traitement neuronales, une bande passante réseau, un stockage et une mémoire.

La configuration leur permet de fonctionner comme des serveurs de relais, d’améliorer les performances informatiques globales des clusters et d’accélérer considérablement la formation des modèles d’IA fondamentaux.

Au-delà de Huawei: la poussée plus large des infrastructures d’IA de la Chine

La percée matérielle de l’IA de Huawei n’existe pas isolément mais représente plutôt une partie d’une poussée plus large des sociétés technologiques chinoises pour construire une infrastructure informatique nationale d’IA.

En février, le géant du commerce électronique Alibaba Group a annoncé un investissement massif de 380 milliards de yuans (52,4 milliards de dollars) dans les ressources informatiques et les infrastructures d’IA sur trois ans – le plus grand investissement par une entreprise chinoise privée dans un projet informatique.

Pour la communauté mondiale de l’IA, l’émergence d’alternatives viables au matériel de Nvidia pourrait éventuellement aborder les goulots d’étranglement informatiques qui ont une progression limitée de l’IA. La concurrence dans cet espace pourrait potentiellement augmenter la capacité informatique disponible et fournir aux développeurs plus d’options pour la formation et le déploiement de leurs modèles.

Cependant, il convient de noter que la publication du rapport, Huawei n’avait pas encore répondu aux demandes de commentaires sur ces réclamations.

Alors que les tensions entre les États-Unis et la Chine continuent de s’intensifier dans le secteur de la technologie, le supernode CloudMatrix 384 de Huawei représente un développement important dans la poursuite de l’autosuffisance technologique par la Chine.

Si les revendications de performance sont vérifiées, cette percée matérielle d’IA signifierait que Huawei a atteint l’indépendance de l’informatique dans ce créneau, malgré des sanctions approfondies.

Le développement signale également une tendance plus large dans le secteur technologique chinois, plusieurs sociétés nationales intensifiant leurs investissements dans les infrastructures d’IA pour capitaliser sur la demande croissante et promouvoir l’adoption de puces locales.

L’effort collectif suggère que la Chine s’engage à développer des alternatives nationales à la technologie américaine dans ce domaine stratégiquement important.

Solène Vernet
Solène Vernet
Journaliste française passionnée par la science et les politiques d’innovation, j’écris pour rendre accessibles des sujets complexes. Mon parcours mêle recherche universitaire, communication scientifique et journalisme. J’aime explorer les liens entre technologie, société et transformation du monde.