Le plan de Deepseek pour former son nouveau modèle d’IA, R2, sur les puces Ascend de Huawei a échoué et a forcé une retraite à Nvidia tout en retardant le lancement.
Pendant des mois, le récit poussé par Pékin est un progrès technologique imparable et une marche vers l’autosuffisance. Cependant, la réalité a l’habitude de mordre. Les problèmes récents de l’AI chinois Darling Deepseek est un exemple de manuel où l’ambition répond au mur dur des limitations techniques.
Après le lancement réussi de son modèle R1 en janvier, Deepseek s’est retrouvé sous la pression de la Chine pour défendre la cause nationale. Selon trois personnes parlant au Financial Times, le message était clair: utilisez les puces de Huawei, pas celles de Nvidia.
En ce qui concerne la formation réellement de leur nouveau modèle R2, les sources disent que Deepseek a rencontré des «problèmes techniques persistants» avec les puces AI de Huawei. Les problèmes ont été si fondamentaux que le projet a terminé. Une personne ayant connaissance de la situation a déclaré que c’était la principale raison pour laquelle le lancement prévu du modèle en mai a été mis au rebut, mettant l’entreprise sur le pied arrière sur un marché qui n’attend personne.
Pour comprendre pourquoi c’est un gros problème, vous devez connaître la différence entre la formation et l’inférence de l’IA. La formation est la partie difficile, comme l’envoi d’un étudiant à l’université pour des années d’apprentissage intense. Il nécessite des quantités colossales de puissance et de stabilité. L’inférence est la partie relativement «facile», comme poser une question au diplômé.
Deepseek a découvert que même si les jetons de Huawei pourraient être prêts pour l’examen final, ils n’étaient pas encore à la hauteur du cours d’université exténuant. L’entreprise n’avait pas d’autre choix que de revenir aux puissants systèmes de Nvidia pour faire la formation. Les sources affirment que l’équipe de Deepseek essaie toujours de faire fonctionner le modèle R2 avec Huawei Chips pour le stade d’inférence moins exigeant.
Deux personnes ont confirmé que Huawei avait même envoyé sa propre équipe d’ingénieurs dans les bureaux de Deepseek pour les aider à mettre le modèle R2 opérationnel sur leurs puces. Mais même avec les experts de la salle, ils n’ont pas pu obtenir une formation réussie.
Parlez à quiconque dans l’industrie, et ils vous diront que ce n’est pas une énorme surprise. Le PDG de Huawei, Ren Zhengfei, a même déclaré plus tôt cette année que les États-Unis « avaient exagéré les réalisations de Huawei » et que la société « n’est pas encore géniale », notant que ses meilleures puces sont toujours une génération derrière.
Cependant, Pékin pousse toujours activement ses géants de la technologie comme favoriser le matériel local, le Financial Times rapportant que les entreprises doivent désormais justifier les ordres de la puce H20 conforme aux exportations de NVIDIA. Cela fait partie d’une stratégie pour construire un champion domestique, mais il peut forcer les entreprises à faire des choix techniquement inférieurs.
Mis à part les problèmes rencontrés par l’utilisation des puces de Huawei pour la formation, le fondateur de Deepseek, Liang Wenfeng, aurait déclaré à son équipe qu’il n’était pas satisfait des progrès globaux vers le modèle R2. On dit qu’il les pousse à viser plus haut et à construire quelque chose qui peut garder l’entreprise parmi les chefs de file de l’industrie de l’IA.
Pour toutes les directives descendantes et la fierté nationale, les lois de l’ingénierie s’appliquent toujours. L’histoire de Deepseek est un rappel que dans la course mondiale pour la suprématie de l’IA, il n’y a pas de raccourcis. La Chine joue le long jeu, mais pour l’instant, la couronne de performance reste fermement sur la tête de Nvidia.