Atténuer le verrouillage du fournisseur avec les modèles multi-agents Sakana AI Fugu

Sakana AI a lancé Fugu pour orchestrer les opérations multi-agents et atténuer les risques de dépendance à un seul fournisseur dans les déploiements d’entreprise.

Les entreprises sont confrontées à des vulnérabilités opérationnelles lorsqu’elles s’appuient entièrement sur des API d’IA monolithiques. La société japonaise d’IA Sakana AI a conçu Fugu en réponse à ces risques de concentration en créant un modèle de langage d’orchestration qui fait appel à un pool de modèles variés pour effectuer des tâches en plusieurs étapes.

Les utilisateurs accèdent à cet écosystème via un seul point de terminaison compatible OpenAI. Fugu achemine les requêtes en interne, décidant s’il convient de résoudre une invite directement ou de constituer une équipe coordonnée de modèles experts pour une analyse plus approfondie. Le système gère la sélection, la délégation, la vérification et la synthèse des modèles en interne. Les équipes d’ingénierie interagissent avec ce qui semble être un modèle unique tandis qu’un système de spécialistes en arrière-plan exécute le calcul proprement dit.

Sakana AI cible les risques géopolitiques et réglementaires associés à l’approvisionnement en IA. Les récents contrôles à l’exportation affectant les modèles anthropiques comme Fable et Mythos ont démontré que l’accès à des architectures fondamentales spécifiques peut disparaître en fonction de décisions de politique étrangère.

Fugu fonctionne comme une protection contre ces perturbations soudaines de la chaîne d’approvisionnement. La plateforme s’appuie sur un pool d’agents entièrement échangeables. Fugu achemine dynamiquement le trafic autour de tout fournisseur restreint ou dégradé pour maintenir la continuité du service. Sakana AI déclare que cette capacité fournit l’architecture résiliente requise pour la souveraineté de l’IA.

Niveaux de déploiement Fugu

Deux niveaux sont disponibles pour répondre à différentes exigences de latence opérationnelle.

Le modèle Fugu standard donne la priorité à une faible latence pour les tâches quotidiennes, en s’intégrant aux outils de développement standard tels que Codex pour le codage en direct et la révision du code. Les organisations soumises à des mandats stricts de gouvernance des données ou de confidentialité peuvent retirer manuellement des modèles sous-jacents spécifiques du pool de routage Fugu standard.

Fugu Ultra cible les problèmes analytiques complexes en plusieurs étapes qui exigent une précision maximale. La variante Ultra coordonne un pool plus approfondi d’agents experts pour des tâches intensives telles que la reproduction d’articles universitaires, les recherches documentaires et l’analyse des brevets.

Sakana AI rapporte que Fugu Ultra est compétitif par rapport aux principaux modèles fermés tels que Fable 5 et Mythos Preview sur des critères scientifiques, techniques et de raisonnement :

La méthode d’orchestration garantit que les entreprises peuvent accéder à des capacités informatiques de premier plan sans supporter le risque de concentration des fournisseurs ou l’exposition au contrôle des exportations inhérente à ces modèles fermés.

Implémentation en cybersécurité

Près de 500 premiers utilisateurs ont testé le système au cours d’un programme bêta étendu axé sur des flux de travail informatiques longs et en plusieurs étapes. La cybersécurité étant une priorité pour des modèles comme Claude Mythos, les équipes d’ingénierie ont déployé Fugu Ultra pour automatiser des cycles complets d’évaluation de la sécurité.

Les opérateurs humains ont émis une instruction ciblée et le moteur d’orchestration a exécuté toute la phase de reconnaissance. Le modèle a effectué avec succès des contrôles de scripts intersites et d’injection SQL ainsi que des examens d’authentification approfondis.

Un ingénieur en cybersécurité participant a confirmé que le modèle restait strictement dans ses paramètres opérationnels et évitait de lancer des actions destructrices contre l’infrastructure cible. Fugu a conclu l’engagement automatisé en générant un rapport de vulnérabilité propre, complet avec des preuves de vérification et des étapes de nouveau test exactes pour les équipes de remédiation humaine.

La mise en œuvre a démontré que le routage multi-agent maintient des limites de conformité strictes tout en exécutant des séquences de tests d’intrusion complexes.

Les équipes de développement de logiciels ont également intégré Fugu Ultra dans leurs principaux pipelines de révision de code pour comparer les taux de détection de défauts par rapport aux outils monolithiques établis. Le moteur d’orchestration a systématiquement surpassé les modèles de base en identifiant les failles logiques et les vulnérabilités de sécurité au sein des bases de code d’entreprise complexes.

« Pour la révision du code, Fugu Ultra est nettement meilleur que GPT-5.5. Il donne des réponses complètes et trouve les bogues manqués par d’autres », a rapporté un ingénieur logiciel impliqué dans le déploiement bêta. « Là où d’autres outils signalent trois problèmes, Fugu en a fait ressortir plus de vingt. C’est devenu le modèle sur lequel j’effectue toutes mes évaluations. »

Recherche automatisée et stabilité de la personnalité

Les unités de science des données ont déployé le système dans un mode de recherche presque entièrement automatisé. Fugu Ultra a exploré avec succès des hypothèses mathématiques, exécuté des exécutions de code expérimental, interprété les états de défaillance et révisé ses propres approches pour maintenir les progrès sur de longues périodes avec une intervention humaine minimale. Cette fonctionnalité répond directement aux limites opérationnelles des modèles à appel unique qui nécessitent une incitation humaine constante pour récupérer des erreurs logiques.

La direction d’une société de plateforme d’entreprise anonyme a identifié la stabilité de la personnalité à long terme comme un principal avantage au cours de ces sessions prolongées. Les architectures monolithiques conventionnelles souffrent souvent d’une dégradation du contexte et d’une dérive identitaire lors du traitement d’historiques conversationnels étendus.

« La qualité du résultat brut est comparable à celle des modèles haut de gamme, mais Fugu a fait preuve d’une stabilité de personnalité inhabituellement forte au cours de longues sessions, conservant son identité là où d’autres modèles dérivent », a déclaré le dirigeant. « Pour les produits d’agents, cela peut avoir plus d’importance que les scores bruts de référence. »

Validation de référence étendue

Sakana AI a construit la logique de routage interne sur la base de recherches approfondies sur l’orchestration de modèles apprise. La base technique du produit découle des conclusions publiées dans les articles ICLR 2026 de la société, en particulier les frameworks Trinity et Conductor.

Ces fondations académiques permettent à Fugu de traiter les demandes en comprenant précisément quand une tâche nécessite une délégation ou une résolution directe. Le modèle de langage interne dicte les protocoles de communication entre les agents individuels et structure la synthèse finale de leurs sorties informatiques distinctes.

Les tests de validation par rapport aux concurrents pionniers de l’IA couvraient des disciplines complexes et ouvertes allant de la prédiction de séries chronologiques financières à la conception mécanique. Fugu a également démontré une grande maîtrise des tests de logique physique et des tâches d’interprétation visuelle, notamment la résolution du Rubik’s Cube et l’analyse de l’écriture japonaise. La capacité à exceller tant en modélisation financière quantitative qu’en traitement qualitatif d’images confirme l’efficacité de l’approche d’orchestration multi-agents.

Sakana AI a conçu le système pour qu’il évolue de manière organique à mesure que le marché plus large du matériel et des logiciels d’IA évolue. Étant donné que le produit s’appuie entièrement sur une logique d’orchestration apprise plutôt que sur des ensembles de règles opérationnelles fixes, il bénéficie automatiquement des innovations tierces. Sakana AI prévoit d’élargir continuellement le pool d’agents experts disponibles.

L’équipe d’ingénierie intégrera les nouveaux outils open source et les modèles propriétaires d’IA Sakana dans le pool de routage dès qu’ils seront disponibles. Les modèles standard Fugu et Fugu Ultra sont aujourd’hui disponibles pour les entreprises clientes.

Bannière pour la série d'événements AI & Big Data Expo.
Solène Vernet
Solène Vernet
Journaliste française passionnée par la science et les politiques d’innovation, j’écris pour rendre accessibles des sujets complexes. Mon parcours mêle recherche universitaire, communication scientifique et journalisme. J’aime explorer les liens entre technologie, société et transformation du monde.