IA open source qui a explique ses compétences de raisonnement

Deep Cogito a publié Cogito V2, une nouvelle famille de modèles d’IA open source qui aiguisent leurs propres compétences de raisonnement.

Sortie sous une licence open source, la nouvelle gamme Cogito V2 comprend quatre modèles de raisonnement hybride AI: deux paramètres de taille moyenne à 70b et 109b, et deux versions à grande échelle aux 405b et 671b.

Le plus grand, un modèle de mélange d’Experts 671b (MOE), est déjà présenté comme l’une des AIS open-source les plus puissantes au monde. La société rapporte qu’elle est en concurrence avec les dernières personnes de Deepseek et comble l’écart sur les systèmes propriétaires comme O3 et Claude 4 Opus.

Mais la vraie histoire ne concerne pas seulement la taille ou la puissance; Il s’agit d’un changement fondamental dans la façon dont l’IA apprend. Au lieu de simplement «penser» plus longtemps au moment de l’inférence pour trouver une réponse, Cogito V2 est conçu pour intérioriser ses propres processus de raisonnement.

Ce raisonnement intériorisé est réalisé grâce à une technique appelée distillation et amplification itérée (IDA), qui distille les découvertes d’une recherche dans les paramètres de base du modèle. L’objectif est de construire une «intuition» plus forte, permettant au modèle d’anticiper le résultat de son propre raisonnement sans avoir à effectuer la recherche entière.

Parce que les modèles d’IA open-source ont une meilleure «sensation d’intestin» pour la bonne approche, leurs chaînes de raisonnement sont 60% plus courtes que celles de rivaux comme Deepseek R1.

Cette efficacité s’étend au budget. Deep Cogito dit qu’il a développé tous ses modèles – des expériences à la formation finale – pour un total combiné de moins de 3,5 millions de dollars. Encore une grande somme probable pour vous ou moi, mais minuscule par rapport aux dépenses de nombreux laboratoires AI.

Le modèle phare 671b a reçu une attention particulière, formé non seulement pour améliorer ses réponses finales, mais pour affiner le processus de réflexion lui-même. Cette approche décourage le modèle de «méandre» et récompense un chemin plus direct vers la solution. Les données de performance suggèrent qu’elle fonctionne, avec le modèle d’IA open-source de Deep Cogito ou dépassant les dernières versions Deepseek sur les références clés tout en étant proche des alternatives propriétaires:

L’un des résultats les plus surprenants est peut-être la capacité des modèles à raisonner sur les images; une compétence pour laquelle ils n’ont jamais été explicitement formés.

L’équipe a partagé un exemple de ce raisonnement où le modèle d’IA open source de Deep Cogito a comparé deux images d’un canard et d’un lion, démontrant un processus de réflexion profonde sur leurs habitats, leurs couleurs et leur composition purement par le transfert d’apprentissage. Deep Cogito estime que cette propriété émergente pourrait être un moyen puissant de bootstrap de formation de données pour les futurs systèmes de raisonnement multimodal.

Pour l’avenir, l’équipe Deep Cogito prévoit de «grimper sur les gains de l’auto-amélioration itérative» dans sa quête pour construire la superintelligence. Ils ont réaffirmé leur engagement selon lequel tous les modèles d’IA qu’ils créent seront open-source.

Solène Vernet
Solène Vernet
Journaliste française passionnée par la science et les politiques d’innovation, j’écris pour rendre accessibles des sujets complexes. Mon parcours mêle recherche universitaire, communication scientifique et journalisme. J’aime explorer les liens entre technologie, société et transformation du monde.