La facture des tokens explose : comment les entreprises gèrent la crise
Uber a épuisé son budget 2026 en 4 mois. Microsoft abandonne Claude. Les entreprises découvrent que l'IA coûte très cher et cherchent des solutions.

Les rêves dorés de l'IA se transforment en cauchemars financiers. Les entreprises qui criaient « nous investirons sans limites dans l'IA » demandent maintenant : « qui a une solution pour arrêter l'hémorragie ? »
Uber a épuisé tout son budget 2026 en AI coding dès avril. Microsoft a supprimé les licences Claude Code pour ses développeurs, quelques mois après les avoir lancées. Un employé chez Priceline rapporte que le renouvellement du contrat Cursor a coûté 4 à 5 fois plus cher qu'à l'année précédente.
Le problème : même si le prix du token (Token — une petite unité de texte que le modèle lit, généralement une fraction de mot) baisse, les entreprises en consomment de plus en plus. Les nouveaux AI Agents (programmes IA capables d'effectuer des tâches de manière autonome, comme réserver des billets ou écrire du code) consomment les tokens de façon déraisonnable. Les entreprises qui ont acheté des « forfaits illimités » en 2025 essaient maintenant de comprendre où est passé l'argent.
« Maintenant, on ne parle que de prix »
Alexander Embricos, responsable Enterprise chez OpenAI, l'explique :
« Il y a 6 mois, je discutais avec les clients de : 'Qu'est-ce que vous pouvez faire ? La qualité est-elle suffisante ?' Maintenant, on ne parle que de : 'Avez-vous de la visibilité sur vos dépenses ? Pouvez-vous contrôler la consommation ? Vos modèles sont-ils efficaces ?' »
Ce changement s'est fait à une vitesse vertigineuse. En avril et mai, les entreprises ont commencé à dire : « Wow, nous avons dépensé 3 fois le budget complet de 2026 en seulement 4 mois ! »
Les chiffres parlent d'eux-mêmes
Une entreprise a oublié de fixer des limites de consommation pour ses employés et s'est retrouvée avec une facture de 500 millions de dollars chez Claude. Chris Reed, responsable des finances techniques chez Priceline, dit : « C'est comme une épidémie de drogue. Ça te laisse essayer d'abord pour que tu t'y habitues, et ensuite tu ne peux plus t'en passer. »
Vitaly Gordon, PDG de Faros AI (plateforme de suivi des projets d'ingénierie), a rencontré un CTO qui lui a dit : « L'un de mes ingénieurs a dépensé 40 000 dollars en tokens ce mois-ci, et je n'ai aucune idée de ce que je dois lui dire d'arrêter ou de dire aux autres de faire pareil. »
La surprise : une étude de Faros en mars a montré que les développeurs qui utilisaient le plus l'IA avaient deux fois moins de productivité que ceux qui l'utilisaient moins. Mais ils consommaient 10 fois plus de tokens.
Nicholas Arcolano de Jellyfish (plateforme de gestion d'équipe technique) rapporte : « La consommation d'IA par développeur a augmenté de 18,6 fois en 9 mois. Et la vraie question est : est-ce que cet argent massif produit des résultats réels ? La plupart des entreprises n'en ont aucune idée. »
Le problème technique : des données par milliards
Suivre les coûts du Cloud était compliqué. Suivre les coûts des tokens est 1 000 fois plus difficile.
J.R. Storment, responsable de la FinOps Foundation (organisation mondiale qui gère les coûts techniques), explique :
« Le suivi du Cloud se faisait avec des centaines de millions de lignes par mois. Les tokens représentent des trillions de lignes. Tu ne peux pas mettre ça dans Excel. Tu dois penser complètement différemment — nouveaux systèmes, nouveaux standards, nouvelle comptabilité. »
Chris Reed de Priceline a vu le problème de ses propres yeux : les données du fournisseur de services (par exemple Anthropic) et les données internes de Priceline ne correspondent pas. « J'ai travaillé avant sur la gestion des coûts téléphoniques et Internet, et je vois les mêmes erreurs ici — des erreurs de facturation et des opportunités d'amélioration partout. »
Un nouveau marché émerge
De nouvelles entreprises commencent à construire des solutions :
- Pay-i : suit et optimise les coûts de GenAI
- Paid : permet aux développeurs de contrôler les dépenses
- Jellyfish et Faros AI : surveillent les performances des AI Agents
- Ramp et Datadog : ont ajouté de nouveaux services pour contrôler les dépenses en IA
AWS va lancer de nouvelles fonctionnalités financières la semaine prochaine.
Mais il y a un problème plus grand : il n'existe pas de langage unifié. Quelle est exactement la valeur d'un token ? Comment comparer les prix entre OpenAI et Anthropic ? Comment mesurer le ROI ?
La solution : Tokenomics Foundation
La Linux Foundation lance une nouvelle organisation cette semaine : Tokenomics Foundation. L'idée : faire pour les tokens ce que FinOps a fait pour le Cloud.
L'organisation va construire :
- Des définitions uniformes de « tokenomics »
- Des standards communs pour la mesure et la facturation
- De nouvelles métriques : cost-per-intelligence, tokens-per-watt
- Des standards pour la token factory effectiveness
Le lancement officiel aura lieu en juillet.
Nishant Gupta de Salesforce dit : « Les tokens sont plus opaques que n'importe quoi sur lequel nous avons travaillé avant. Tu dois développer un muscle technique complètement nouveau. »
L'avenir : 24 fois plus
Goldman Sachs prévoit que la consommation de tokens va multiplier par 24 d'ici 2030. Les entreprises qui sont actuellement en crise n'ont pas le temps d'attendre la solution parfaite.
Vitaly Gordon dit : « Peut-être que nous avons créé un moteur à vapeur, mais nous ne savons pas encore comment construire la chaîne de production. »
Nicholas Arcolano de Jellyfish dit l'essentiel : « Le meilleur ROI ne vient pas de laisser les heavy users dépenser plus. Il vient de déplacer la majorité d'une consommation faible à une consommation modérée. »
Qu'est-ce que ça signifie pour toi ?
Les grandes entreprises marocaines — banques, opérateurs télécom, cabinets d'ingénierie — font face à la même crise. Les nouveaux AI Agents améliorent la productivité, mais la facture reste opaque. Les professionnels indépendants comme les consultants et avocats peuvent utiliser l'IA intelligemment — pas sans limites. Et les développeurs marocains peuvent construire de nouveaux outils pour aider les entreprises à contrôler leurs dépenses. Cette opportunité sera énorme dans les années à venir, surtout pour les startups intéressées par la gestion des coûts d'IA.
Articles liés
infrastructureAirTrunk investit 30 milliards de dollars dans les data centers IA en Inde
La société australienne AirTrunk, financée par Blackstone, va construire 5 gigawatts de nouveaux data centers en Inde. Un investissement de 30 milliards de dollars d'ici 2030.
infrastructureGoogle paie à SpaceX 920 millions par mois pour des GPU
SpaceX et Google signent un contrat géant : 920 millions de dollars mensuels d'octobre 2026 à juin 2029 pour accéder à 110 000 GPU. Un reflet de la bataille féroce pour la puissance de calcul en IA.
enterpriseUber plafonne les dépenses en IA après avoir épuisé son budget annuel en 4 mois
Uber impose une limite stricte : 1 500 $ par mois par employé pour les outils d'IA. La raison ? L'entreprise a brûlé tout son budget annuel en quatre mois.
fundingAlphabet lève 85 milliards de dollars : la fièvre de l'IA gagne Wall Street
Le plus grand appel public à l'épargne de l'histoire. Les investisseurs se ruent sur les actions d'Alphabet, affamés d'IA. Ces milliards vont financer les data centers et l'infrastructure.
