Comment Moonshot AI a battu GPT-5 et Claude à une fraction du coût - Actualité sur le financement de l'innovation

Moonshot, une start-up chinoise d’IA, a bouleversé les attentes en matière de développement de l’intelligence artificielle après que son modèle Kimi K2 Thinking a dépassé le GPT-5 d’OpenAI et le Claude Sonnet 4.5 d’Anthropic sur plusieurs critères de performance, suscitant un nouveau débat sur la question de savoir si la domination américaine de l’IA est remise en question par l’innovation chinoise rentable.

Moonshot AI, basée à Pékin, évaluée à 3,3 milliards de dollars et soutenue par les géants de la technologie Alibaba Group Holding et Tencent Holdings, a publié le modèle open source Kimi K2 Thinking le 6 novembre, réalisant ce que les observateurs du secteur appellent un autre « moment DeepSeek » – une référence à la perturbation antérieure des hypothèses de coûts de l’IA par la startup basée à Hangzhou.

🚀 Bonjour, Kimi K2 Thinking !
Le modèle d’agent de réflexion open source est ici.

🔹 SOTA sur HLE (44,9%) et BrowseComp (60,2%)
🔹 Exécute jusqu’à 200 à 300 appels d’outils séquentiels sans interférence humaine
🔹 Excelle dans le raisonnement, la recherche agentique et le codage
🔹 Fenêtre contextuelle de 256 Ko

Construit… pic.twitter.com/lZCNBIgbV2

– Kimi.ai (@Kimi_Moonshot) 6 novembre 2025

Les mesures de performance remettent en question les modèles américains

Selon le blog GitHub de la société, Kimi K2 Thinking a obtenu un score de 44,9 % au Humanity’s Last Exam, un vaste test de modèle de langage composé de 2 500 questions sur un large éventail de sujets, dépassant les 41,7 % du GPT-5.

Le modèle a également obtenu 60,2 % au benchmark BrowseComp, qui évalue la compétence de navigation sur le Web et la persistance dans la recherche d’informations des grands agents de modèles de langage, et a obtenu 56,3 % pour être en tête du benchmark Seal-0 conçu pour défier les modèles de recherche augmentés sur des requêtes de recherche du monde réel.

EntrepriseBeat a rapporté que la version entièrement ouverte, qui atteint ou dépasse les scores de GPT-5, marque un tournant où l’écart entre les systèmes à frontières fermées et les modèles accessibles au public s’est effectivement effondré pour le raisonnement et le codage haut de gamme.

Kimi K2 Thinking est le nouveau modèle de pondération ouvert leader : il démontre une force particulière dans les contextes agentiques mais est très verbeux, générant le plus de jetons de tous les modèles pour compléter nos évaluations de l’indice d’intelligence.@Kimi_MoonshotKimi K2 Thinking de atteint un 67 dans le… pic.twitter.com/m6SvpW7iif

– Analyse artificielle (@ArtificialAnlys) 7 novembre 2025

La rentabilité soulève des questions

La popularité du modèle a augmenté après que CNBC a annoncé que son coût de formation n’était que de 4,6 millions de dollars, bien que Moonshot AI n’ait pas fait de commentaire sur le coût. D’après les calculs du Poste du matin de la Chine du Sudle coût de l’interface de programmation d’applications de Kimi K2 Thinking était six à 10 fois moins cher que celui des modèles OpenAI et Anthropic.

Le modèle utilise une architecture de mélange d’experts avec un billion de paramètres au total, dont 32 milliards sont activés par inférence, et a été formé à l’aide de la quantification INT4 pour obtenir une amélioration de la vitesse de génération d’environ deux fois tout en maintenant des performances de pointe.

Thomas Wolf, co-fondateur de Hugging Face, a commenté sur X que Kimi K2 Thinking était un autre cas de modèle open source passant par un modèle fermé, demandant : « Est-ce un autre moment DeepSeek ? Devrions-nous nous attendre à (un) tous les deux mois maintenant ? »

Capacités et limites techniques

Les chercheurs de Moonshot AI ont déclaré que Kimi K2 Thinking avait établi « de nouveaux records en matière de références qui évaluent le raisonnement, le codage et les capacités des agents ». Le modèle peut exécuter jusqu’à 200 à 300 appels d’outils séquentiels sans interférence humaine, raisonnant de manière cohérente sur des centaines d’étapes pour résoudre des problèmes complexes.

Des tests indépendants réalisés par le cabinet de conseil Artificial Analysis ont placé Kimi K2 au sommet de son benchmark agent Tau-2 Bench Telecom avec une précision de 93 %, ce qui a été décrit comme le score le plus élevé qu’il ait mesuré de manière indépendante.

Cependant, Nathan Lambert, chercheur à l’Allen Institute for AI, a suggéré qu’il y avait encore un décalage d’environ quatre à six mois dans les performances brutes entre les meilleurs modèles fermés et ouverts, tout en reconnaissant que les laboratoires chinois se rapprochaient et obtenaient de très bons résultats sur les critères clés.

Implications sur le marché et pression concurrentielle

Zhang Ruiwang, un architecte de systèmes informatiques basé à Pékin, a déclaré que la tendance était pour les entreprises chinoises de maintenir leurs coûts à un niveau bas, expliquant : « Les performances globales des modèles chinois sont toujours à la traîne par rapport aux meilleurs modèles américains, elles doivent donc rivaliser dans le domaine de la rentabilité pour pouvoir s’en sortir ».

Zhang Yi, analyste en chef du cabinet de conseil iiMedia, a déclaré que les coûts de formation des modèles d’IA chinois connaissaient une « baisse abrupte » due à l’innovation dans l’architecture des modèles et les techniques de formation, ainsi qu’à la saisie de données de formation de qualité, marquant un abandon de l’accumulation de ressources informatiques des premiers jours.

Le modèle a été publié sous une licence MIT modifiée qui accorde tous les droits commerciaux et dérivés, avec une restriction : les déployeurs desservant plus de 100 millions d’utilisateurs actifs par mois ou générant plus de 20 millions de dollars de revenus par mois doivent afficher bien en évidence « Kimi K2 » sur l’interface utilisateur du produit.

Réponse de l’industrie et perspectives d’avenir

Deedy Das, partenaire de la société de capital-risque Menlo Ventures, a écrit dans un article sur X que « Aujourd’hui, c’est un tournant dans l’IA. Un modèle open source chinois est n°1. Moment fondateur de l’IA ».

🚨 Aujourd’hui, c’est un tournant dans l’IA. Un modèle open source chinois est le n°1.

Kimi K2 Thinking a obtenu un score de 51 % au dernier examen de l’humanité, un score supérieur à GPT-5 et à tous les autres modèles. 0,6 $/M en entrée, 2,5 $/M en sortie.

Le meilleur en écriture, et fait 15tps sur deux Mac M3 Ultra !

Moment fondateur de l’IA.

Essayez-le… pic.twitter.com/fmxlxpCGbE

– Deedy (@deedydas) 7 novembre 2025

Nathan Lambert a écrit dans un article de Substack que le succès des développeurs chinois d’IA open source, notamment Moonshot AI et DeepSeek, a montré comment ils « ont fait transpirer les laboratoires fermés », ajoutant « il y a une sérieuse pression sur les prix et des attentes que (les développeurs américains) doivent gérer ».

Cette version positionne Moonshot AI aux côtés d’autres sociétés chinoises d’IA comme DeepSeek, Qwen et Baichuan, qui remettent de plus en plus en question le récit de la suprématie américaine de l’IA grâce à une innovation rentable et à des stratégies de développement open source.

Reste à savoir si cela représente un avantage concurrentiel durable ou une convergence temporaire des capacités, alors que les entreprises américaines et chinoises continuent de faire progresser leurs modèles.

Le caractère public des déclarations et la réaction du marché suggèrent que des discussions de fond pourraient bientôt avoir lieu.

Le paysage des puces IA entre dans une période de mutation. Les organisations doivent maintenir une certaine flexibilité dans leur stratégie d’infrastructure et surveiller la manière dont des partenariats tels que Tesla-Intel pourraient remodeler la dynamique concurrentielle de la fabrication de matériel d’IA.

Les décisions prises aujourd’hui concernant les partenariats de fabrication de puces pourraient déterminer quelles organisations auront accès à une infrastructure d’IA rentable et performante dans les années à venir.

Photo par Moonshot AI)