La puce Nvidia Vera vise un marché de 200 milliards de dollars alors que Huang ouvre un deuxième front

La puce Nvidia Vera fait rarement la une des journaux lorsque les bénéfices dépassent les estimations, mais cela devrait l’être. Lorsque Nvidia a annoncé mercredi un chiffre d’affaires de 81,62 milliards de dollars pour le premier trimestre, dépassant les estimations des analystes de 78,86 milliards de dollars, et a guidé le deuxième trimestre à 91 milliards de dollars, soit bien au-dessus des prévisions de 86,84 milliards de dollars de Wall Street, les chiffres ont fait ce que font toujours les chiffres de Nvidia : dominer la pièce.

Mais enfoui dans la conférence téléphonique du PDG Jensen Huang avec les analystes, il y avait quelque chose de plus intéressant sur le plan stratégique qu’un autre rythme trimestriel. Huang a déclaré aux analystes que les nouveaux processeurs centraux Vera de Nvidia ouvraient l’accès à un marché de 200 milliards de dollars, un marché qui se situe entièrement en dehors des 1 000 milliards de dollars que la société a déjà prévus pour sa gamme de GPU Blackwell et Rubin AI entre 2025 et 2027.

Il s’attend à ce que les revenus des puces Vera atteignent 20 milliards de dollars d’ici la fin de cet exercice. « Je m’attends à ce que (Vera) soit le deuxième plus grand contributeur aux ventes », a déclaré Huang lors de l’appel.

Ce n’est pas une note de bas de page. C’est un deuxième front.

La puce Vera et le pivot d’inférence

La raison pour laquelle Nvidia a besoin d’un deuxième front est simple : ses plus gros clients construisent le leur. Google, Amazon et Microsoft, qui devraient collectivement investir plus de 700 milliards de dollars dans l’infrastructure d’IA cette année, soit une forte hausse par rapport aux 400 milliards de dollars environ en 2025, investissent simultanément des fonds dans du silicium personnalisé pour exécuter des modèles d’IA. Intel et AMD présentent également les processeurs comme un outil crédible pour les charges de travail d’inférence.

Le discours dans l’industrie des puces est passé de celui qui peut former le plus gros modèle à celui qui peut le servir le moins cher et le plus rapidement. L’inférence est le domaine où la domination des GPU de Nvidia est la plus exposée. La formation de grands modèles relève toujours du territoire de Nvidia, mais l’inférence, générant des réponses à grande échelle, en temps réel, est de plus en plus le domaine où les puces personnalisées de la gamme TPU de Google, Trainium d’Amazon et d’autres font valoir leurs arguments.

La réponse de Nvidia est Vera. La puce, développée en partie à l’aide de la technologie de Groq, une startup spécialisée dans l’inférence dont Nvidia a licencié dans le cadre d’un accord d’une valeur d’environ 17 milliards de dollars, cible exactement cette charge de travail. La plate-forme complète Vera Rubin, qui combine le processeur Vera et les GPU Rubin, devrait être lancée plus tard cette année.

L’offre est déjà la contrainte

Huang a été franc sur un problème : l’approvisionnement. « J’ai le sentiment que nous serons limités en termes d’offre pendant toute la vie de Vera Rubin », a-t-il déclaré lors de l’appel. C’est un aveu révélateur pour un produit que Nvidia positionne comme un pilier de croissance majeur. Pour anticiper les perturbations, Nvidia investit massivement dans la chaîne d’approvisionnement. La société a révélé que ses engagements d’approvisionnement ont atteint 119 milliards de dollars au premier trimestre, contre 95,2 milliards de dollars au trimestre précédent, une hausse significative qui reflète à la fois la confiance dans la demande et l’anxiété face à une crise mondiale des puces mémoire.

Nvidia a également annoncé un programme de rachat d’actions de 80 milliards de dollars et a augmenté son dividende trimestriel en espèces de 1 cent à 25 cents par action, ce qui témoigne de la confiance financière, même si Huang a mis en garde contre un resserrement de l’offre.

La question que se posent les investisseurs

Malgré les difficultés, les actions Nvidia ont chuté de 1,6% dans les échanges prolongés après les résultats. L’analyste d’eMarketer, Jacob Bourne, a capturé l’ambiance : « Nvidia a livré un autre rythme, mais à ce stade, cela est essentiellement pris en compte car il continue de battre trimestre après trimestre. La question persistante est de savoir si cela peut convaincre les investisseurs que le développement de l’IA sera durable jusqu’en 2027 et 2028, d’autant plus que le récit s’oriente vers les charges de travail d’inférence et les siliciums concurrents de Google, Amazon, AMD et Intel. « 

Huang a riposté avec ses propres chiffres. Il a souligné un sous-segment croissant de clients cloud spécifiques à l’IA dont les dépenses sont désormais à peu près égales à celles des hyperscalers, mais dont la croissance est plus rapide d’un trimestre à l’autre. « Nous devrions connaître une croissance plus rapide que les investissements à grande échelle », a-t-il déclaré.

La puce Vera est au cœur de cet argument. La question de savoir si la chaîne d’approvisionnement coopère est une tout autre question.

(Source de l’image : salle de presse de Nvidia)

Voir aussi : L’accord Nvidia H200 Chine a survécu au sommet Trump-Xi – mais pas de la manière attendue

Solène Vernet
Solène Vernet
Journaliste française passionnée par la science et les politiques d’innovation, j’écris pour rendre accessibles des sujets complexes. Mon parcours mêle recherche universitaire, communication scientifique et journalisme. J’aime explorer les liens entre technologie, société et transformation du monde.