Walmart aurait commencé à limiter l’utilisation par ses employés d’un assistant d’IA interne appelé Code Puppy après que les exigences imposées au LLM soutenant l’outil aient été plus élevées que prévu. Les employés de Walmart ont été encouragés à utiliser Code Puppy sans aucune restriction ni stipulation quant aux limites d’utilisation, mais Walmart attribue désormais aux employés un nombre fixe de jetons IA, ce qui limite leur utilisation. Code Puppy a été présenté comme étant capable d’aider dans des tâches telles que l’analyse de feuilles de calcul, la création de présentations et d’autres activités automatisables sur le lieu de travail.
Le changement de politique interne est une mesure de contrôle des coûts, car les LLM passent de plus en plus au paiement à l’utilisation, plutôt qu’au modèle d’abonnement à prix fixe qui donnait un accès quasi illimité à l’inférence de l’IA. Walmart compte environ 2,1 millions d’employés, de sorte que même de modestes requêtes et demandes de tâches par employé peuvent générer des coûts importants.
Les conseils de Walmart aux employés sont d’utiliser l’IA là où elle peut créer de la valeur, et ils sont accompagnés de conseils sur la manière dont les travailleurs doivent choisir le bon outil d’IA pour une tâche donnée. Le rapport indique également que les employés ont accès à d’autres plates-formes d’IA payées par l’entreprise.
Walmart a étendu l’utilisation des outils d’IA dans l’entreprise et a dispensé une formation à ses employés sur la façon d’utiliser une IA, encourageant ainsi les travailleurs à expérimenter et à adopter des utilisations efficaces. Désormais, les coûts de chaque interaction sont facturés directement, ce qui fait partie des autres grandes entreprises qui ont du mal à équilibrer les améliorations de productivité signalées avec le coût nécessaire pour y parvenir.
Au moins une partie du problème peut provenir des méthodes utilisées pour mesurer la productivité dans les flux de travail basés sur l’IA. Auparavant, le suivi du nombre et de la complexité des utilisations des outils d’IA comme mesure de la productivité a conduit de nombreux employés à « gamifier » leurs KPI – ce qu’on appelle le « token maxxing ». Pas plus tard qu’en avril de cette année, un partenaire de Sequoia Capital a déclaré Le Wall Street Journal« Nous devrions tous faire du tokenmaxxing », une approche qui a abouti à l’émergence de classements de l’IA dans les entreprises pour célébrer ceux qui utilisent au mieux les logiciels d’IA.
De telles pratiques performatives dans les entreprises entraîneront de plus en plus de coûts en fonction du nombre et de la complexité des tâches d’IA, ainsi que du modèle choisi pour les exécuter. Les modèles plus grands qui effectuent des actions récursives (« modèles pensants ») utilisent davantage de jetons pour traiter les entrées de manière introspective, ce qui entraîne des factures plus élevées pour les utilisateurs. En encourageant les travailleurs à choisir leur modèle avec soin, Walmart tente de limiter les dépenses en modèles coûteux et frontières pour accomplir des tâches relativement triviales, telles que l’analyse de feuilles de calcul et la création de présentations.
Le travail de l’IA multi-agents peut également générer des coûts inattendus pour les employeurs. Lorsque les employés lancent des boucles itératives exécutées sur plusieurs agents afin de créer le résultat souhaité, le coût réel des résultats sous-optimaux (et du raffinement et de la soumission nécessaires des invites) est désormais mesurable en espèces sonnantes et trébuchantes.
Bien que tous les fournisseurs d’IA n’aient pas modifié l’intégralité de leurs modèles de facturation, passant d’abonnements fixes à des abonnements par jeton, Anthropic et OpenAI ont déjà déplacé leurs plans d’entreprise de niveau supérieur vers de nouvelles bases. La décision de Microsoft de facturer ses outils de développement logiciel GitHub Copilot à compter du 1er juin s’inscrit dans ce qui devient rapidement la nouvelle normalité financière pour les fournisseurs de modèles. Uber a récemment révélé qu’il avait utilisé son budget 2026 pour les dépenses en IA au cours des quatre premiers mois de l’année ; un témoignage des changements dans la politique de tarification affectant les utilisateurs finaux.
En fixant des limites à l’utilisation des jetons par employé, Walmart s’efforce de maîtriser ses coûts permanents, d’imposer une utilisation plus réfléchie des outils d’IA et de lui permettre d’établir des mesures de retour sur investissement dans l’IA.
(Source de l’image : Pixabay, sous licence.)