Huawei devrait commencer des expéditions à grande échelle de la puce ASENC 910C AI dès le mois prochain, selon des personnes familières avec la question.
Bien que des quantités limitées aient déjà été livrées, le déploiement de masse marquerait une étape importante pour les entreprises chinoises à la recherche d’alternatives nationales aux semi-conducteurs fabriqués aux États-Unis.
Cette décision intervient à un moment où les développeurs chinois sont confrontés à des restrictions plus strictes sur l’accès au matériel NVIDIA. Le gouvernement américain a récemment informé NVIDIA que les ventes de sa puce AI H20 vers la Chine nécessitaient une licence d’exportation. Cela a laissé les développeurs en Chine à la recherche d’options qui peuvent prendre en charge les charges de travail de formation et d’inférence à grande échelle.
La puce Huawei Ascend 910C n’est pas construite sur les nœuds de processus les plus avancés, mais il représente une solution de contournement. La puce est essentiellement une version à double package du 910b précédent, avec deux processeurs pour doubler les performances et la mémoire. Des sources familières avec la puce disent qu’elle fonctionne de manière comparable au H100 de Nvidia.
Plutôt que de s’appuyer sur la fabrication de pointe, Huawei a adopté une approche brute-force, combinant plusieurs puces et des interconnexions optiques à grande vitesse pour augmenter les performances. Cette approche est au cœur du système CloudMatrix 384 de Huawei, une plate-forme AI à l’échelle à rack complète pour la formation de grands modèles.
Le CloudMatrix 384 comprend 384 puces Huawei Ascend 910C déployées dans 16 racks comprenant 12 racks de calcul et quatre réseaux. Contrairement aux systèmes à base de cuivre, la plate-forme de Huawei utilise des interconnexions optiques, permettant une communication à large bande passante entre les composants du système. Selon l’analyse de la semianalyse, l’architecture comprend 6 912 800G d’émetteurs-récepteurs optiques LPO pour former un réseau optique de maillage tout pour tout.
Cela permet au système de Huawei de fournir environ 300 Petaflops de puissance de calcul BF16 – dépassant le système GB200 NVL72 de NVIDIA, qui atteint environ 180 BF16 Petaflops. Le CloudMatrix revendique également des avantages dans la bande passante et la capacité de mémoire plus élevée, offrant plus du double de la bande passante et plus de 3,6 fois la capacité de mémoire à haute bande passante (HBM).
Les gains, cependant, ne sont pas sans inconvénients. Le système Huawei devrait être 2,3 fois moins efficace par fonctionnement du point flottant que le GB 200 de NVIDIA et a une efficacité de puissance plus faible par unité de bande passante et de capacité. Malgré la baisse des performances par Watt, le système de Huawei fournit toujours l’infrastructure nécessaire pour former des modèles AI avancés à grande échelle.
Des sources indiquent que la plus grande fonderie de puce de la Chine, SMIC, produit certains des principaux composants du 910C en utilisant son processus 7 nm N + 2. Les niveaux de rendement restent cependant une préoccupation, et certaines des unités 910C incluraient des puces produites par TSMC pour la société chinoise Sophgo. Huawei a nié utiliser des pièces fabriquées par TSMC.
Le Département du commerce américain enquête actuellement sur la relation entre TSMC et Sophgo après qu’une puce conçue par Sophgo a été trouvée dans le processeur précédent de Huawei 910B. TSMC a soutenu qu’il n’a pas fourni Huawei depuis 2020 et continue de se conformer aux réglementations d’exportation.
À la fin de 2023, Huawei a commencé à distribuer des échantillons précoces du 910C aux sociétés technologiques sélectionnées et a ouvert ses livres de commandes. Le cabinet de conseil Albright Stonebridge Group a suggéré que la puce est susceptible de devenir le choix de référence pour les entreprises chinoises qui construisent de grands modèles d’IA ou le déploiement de la capacité d’inférence, compte tenu des contrôles d’exportation en cours sur les puces de fabrication américaine.
Bien que le Huawei Ascend 910C ne corresponde pas à NVIDIA dans l’efficacité électrique ou la technologie de processus, elle signale une tendance plus large. Les entreprises de technologie chinoise développent des alternatives locales aux composants étrangers, même si cela signifie utiliser des méthodes moins avancées pour obtenir des résultats similaires.
Alors que la demande mondiale de l’IA de la demande et des restrictions d’exportation se resserrent, la capacité de Huawei à fournir une solution matérielle d’IA évolutive au niveau national pourrait aider à façonner l’avenir de l’intelligence artificielle de la Chine – d’autant plus que les développeurs cherchent à sécuriser les chaînes d’approvisionnement à long terme et à réduire l’exposition au risque géopolitique.
(Photo via UNSPLASH)