La stratégie de puces d'agent IA d'Alibaba va au-delà de Nvidia - Actualité sur le financement de l'innovation

Alibaba a dévoilé un nouveau processeur d’IA spécialement conçu pour les agents d’IA, associant l’annonce de la puce à une feuille de route pluriannuelle sur le silicium et à un nouveau modèle de langage à grande échelle, signalant que l’entreprise construit une pile d’IA intégrée, et ne se contente pas de combler un vide laissé par les contrôles à l’exportation américains.

Le Zhenwu M890, développé par T-Head, filiale de semi-conducteurs d’Alibaba, offre trois fois les performances de son prédécesseur, le Zhenwu 810E, selon la société, selon Reuters rapport. Mais l’augmentation des performances est moins notable que l’intention architecturale derrière la puce : le M890 est spécialement conçu pour les agents IA, où les systèmes logiciels doivent conserver de longues périodes de contexte, se coordonner avec d’autres modèles en temps réel et exécuter des tâches complexes en plusieurs étapes avec une intervention humaine limitée.

Ces demandes, lourdes en bande passante mémoire et en communication inter-modèles, sont très différentes de celles pour lesquelles les puces d’inférence standard sont optimisées. La différence est importante car elle vous dit quelque chose sur la direction vers laquelle Alibaba pense que le calcul de l’IA se dirige. L’entreprise ne conçoit pas autour du cas d’utilisation dominant d’aujourd’hui ; il construit le profil de charge de travail qu’il espère définir pour l’IA d’entreprise au cours des prochaines années.

Conçu pour les agents IA, pas seulement pour l’inférence

La feuille de route qu’Alibaba a présentée à ses côtés est plus importante que la puce elle-même. Le M890 sera suivi par le V900 au troisième trimestre 2027, qui devrait offrir un gain de performances environ trois fois plus, suivi du J900 au troisième trimestre 2028. Il s’agit d’une cadence délibérée et soutenue de mises à niveau internes du silicium qui reflète le type de cycles de produits tic-tac que Nvidia a utilisé pour maintenir son avance dans les accélérateurs d’IA.

Le parallèle avec Huawei mérite d’être noté. Huawei a présenté une feuille de route similaire pour sa gamme Ascend l’année dernière, et les deux annonces reflètent la même réalité sous-jacente : les entreprises technologiques chinoises ont conclu que dépendre du silicium étranger, même dans des scénarios où les restrictions à l’exportation pourraient être assouplies, constitue un risque structurel qu’elles ne peuvent pas accepter. La réponse a été de considérer le développement des semi-conducteurs comme un exercice de renforcement des capacités à long terme plutôt que comme un problème d’approvisionnement.

L’engagement d’Alibaba dans cet exercice n’est pas superficiel. L’année dernière, la société a promis plus de 380 milliards de yuans, soit environ 53 milliards de dollars, pour l’infrastructure cloud et l’IA sur trois ans, son plus grand investissement jamais réalisé dans le secteur. Le M890 et ses successeurs sont en aval de ces dépenses.

Une traction antérieure à l’annonce

T-Head a déclaré avoir expédié plus de 560 000 unités Zhenwu à ce jour, avec plus de 400 clients externes dans 20 secteurs déployant les puces, notamment des constructeurs automobiles et des sociétés de services financiers. Il s’agit d’une empreinte de production matérielle, et non de matériel de laboratoire, et elle fournit à Alibaba des données de déploiement réelles à grande échelle avant le déploiement du M890.

La nouvelle puce sera disponible pour les entreprises clientes chinoises via la plate-forme modèle nationale d’Alibaba Cloud, Bailian, emballée dans le Panjiu AL128, un système serveur qui empile 128 accélérateurs M890 dans un seul rack.

Le côté logiciel de la pile

Parallèlement au matériel, Alibaba a annoncé Qwen 3.7-Max, la dernière version de son modèle phare de grand langage, décrit comme conçu pour le codage avancé et les tâches d’agent de longue durée. La société a déclaré que le modèle peut fonctionner en continu jusqu’à 35 heures sans dégradation des performances, une spécification de capacité qui n’a de sens que si vous envisagez un fonctionnement autonome étendu.

Le timing est délibéré. Lancer une puce et un modèle optimisés pour la même classe de charge de travail le même jour est un jeu de plateforme. Alibaba construit une boucle fermée : son propre silicium dans T-Head, son propre modèle dans Qwen, sa propre livraison cloud à Bailian. Chaque composant renforce les autres et la pile combinée est conçue pour réduire la dépendance des entreprises clientes à l’égard de tout fournisseur externe.

Un demi-million de jetons expédiés. Un successeur arrivant en 2027, un autre en 2028. T-Head ne fait pas de couverture. À un moment donné, s’appuyer sur les contrôles à l’exportation américains cesse d’être une solution de contournement et commence à être une stratégie. Alibaba semble avoir franchi cette ligne.

(Source de l’image : La Maison Blanche)

Voir aussi : Alibaba Qwen remet en question l’économie du modèle d’IA propriétaire