enterprisePublié le 6 juin 20264 min de lecture

La facture des tokens explose : comment les entreprises gèrent la crise

Uber a épuisé son budget 2026 en 4 mois. Microsoft abandonne Claude. Les entreprises découvrent que l'IA coûte très cher et cherchent des solutions.

الفاتورة ديال التوكنات وصلات: كيفاش الشركات كتدير كارثة الأسعار

Les rêves dorés de l'IA se transforment en cauchemars financiers. Les entreprises qui criaient « nous investirons sans limites dans l'IA » demandent maintenant : « qui a une solution pour arrêter l'hémorragie ? »

Uber a épuisé tout son budget 2026 en AI coding dès avril. Microsoft a supprimé les licences Claude Code pour ses développeurs, quelques mois après les avoir lancées. Un employé chez Priceline rapporte que le renouvellement du contrat Cursor a coûté 4 à 5 fois plus cher qu'à l'année précédente.

Le problème : même si le prix du token (Token — une petite unité de texte que le modèle lit, généralement une fraction de mot) baisse, les entreprises en consomment de plus en plus. Les nouveaux AI Agents (programmes IA capables d'effectuer des tâches de manière autonome, comme réserver des billets ou écrire du code) consomment les tokens de façon déraisonnable. Les entreprises qui ont acheté des « forfaits illimités » en 2025 essaient maintenant de comprendre où est passé l'argent.

« Maintenant, on ne parle que de prix »

Alexander Embricos, responsable Enterprise chez OpenAI, l'explique :

« Il y a 6 mois, je discutais avec les clients de : 'Qu'est-ce que vous pouvez faire ? La qualité est-elle suffisante ?' Maintenant, on ne parle que de : 'Avez-vous de la visibilité sur vos dépenses ? Pouvez-vous contrôler la consommation ? Vos modèles sont-ils efficaces ?' »

Ce changement s'est fait à une vitesse vertigineuse. En avril et mai, les entreprises ont commencé à dire : « Wow, nous avons dépensé 3 fois le budget complet de 2026 en seulement 4 mois ! »

Les chiffres parlent d'eux-mêmes

Une entreprise a oublié de fixer des limites de consommation pour ses employés et s'est retrouvée avec une facture de 500 millions de dollars chez Claude. Chris Reed, responsable des finances techniques chez Priceline, dit : « C'est comme une épidémie de drogue. Ça te laisse essayer d'abord pour que tu t'y habitues, et ensuite tu ne peux plus t'en passer. »

Vitaly Gordon, PDG de Faros AI (plateforme de suivi des projets d'ingénierie), a rencontré un CTO qui lui a dit : « L'un de mes ingénieurs a dépensé 40 000 dollars en tokens ce mois-ci, et je n'ai aucune idée de ce que je dois lui dire d'arrêter ou de dire aux autres de faire pareil. »

La surprise : une étude de Faros en mars a montré que les développeurs qui utilisaient le plus l'IA avaient deux fois moins de productivité que ceux qui l'utilisaient moins. Mais ils consommaient 10 fois plus de tokens.

Nicholas Arcolano de Jellyfish (plateforme de gestion d'équipe technique) rapporte : « La consommation d'IA par développeur a augmenté de 18,6 fois en 9 mois. Et la vraie question est : est-ce que cet argent massif produit des résultats réels ? La plupart des entreprises n'en ont aucune idée. »

Le problème technique : des données par milliards

Suivre les coûts du Cloud était compliqué. Suivre les coûts des tokens est 1 000 fois plus difficile.

J.R. Storment, responsable de la FinOps Foundation (organisation mondiale qui gère les coûts techniques), explique :

« Le suivi du Cloud se faisait avec des centaines de millions de lignes par mois. Les tokens représentent des trillions de lignes. Tu ne peux pas mettre ça dans Excel. Tu dois penser complètement différemment — nouveaux systèmes, nouveaux standards, nouvelle comptabilité. »

Chris Reed de Priceline a vu le problème de ses propres yeux : les données du fournisseur de services (par exemple Anthropic) et les données internes de Priceline ne correspondent pas. « J'ai travaillé avant sur la gestion des coûts téléphoniques et Internet, et je vois les mêmes erreurs ici — des erreurs de facturation et des opportunités d'amélioration partout. »

Un nouveau marché émerge

De nouvelles entreprises commencent à construire des solutions :

  • Pay-i : suit et optimise les coûts de GenAI
  • Paid : permet aux développeurs de contrôler les dépenses
  • Jellyfish et Faros AI : surveillent les performances des AI Agents
  • Ramp et Datadog : ont ajouté de nouveaux services pour contrôler les dépenses en IA

AWS va lancer de nouvelles fonctionnalités financières la semaine prochaine.

Mais il y a un problème plus grand : il n'existe pas de langage unifié. Quelle est exactement la valeur d'un token ? Comment comparer les prix entre OpenAI et Anthropic ? Comment mesurer le ROI ?

La solution : Tokenomics Foundation

La Linux Foundation lance une nouvelle organisation cette semaine : Tokenomics Foundation. L'idée : faire pour les tokens ce que FinOps a fait pour le Cloud.

L'organisation va construire :

  • Des définitions uniformes de « tokenomics »
  • Des standards communs pour la mesure et la facturation
  • De nouvelles métriques : cost-per-intelligence, tokens-per-watt
  • Des standards pour la token factory effectiveness

Le lancement officiel aura lieu en juillet.

Nishant Gupta de Salesforce dit : « Les tokens sont plus opaques que n'importe quoi sur lequel nous avons travaillé avant. Tu dois développer un muscle technique complètement nouveau. »

L'avenir : 24 fois plus

Goldman Sachs prévoit que la consommation de tokens va multiplier par 24 d'ici 2030. Les entreprises qui sont actuellement en crise n'ont pas le temps d'attendre la solution parfaite.

Vitaly Gordon dit : « Peut-être que nous avons créé un moteur à vapeur, mais nous ne savons pas encore comment construire la chaîne de production. »

Nicholas Arcolano de Jellyfish dit l'essentiel : « Le meilleur ROI ne vient pas de laisser les heavy users dépenser plus. Il vient de déplacer la majorité d'une consommation faible à une consommation modérée. »

Qu'est-ce que ça signifie pour toi ?

Les grandes entreprises marocaines — banques, opérateurs télécom, cabinets d'ingénierie — font face à la même crise. Les nouveaux AI Agents améliorent la productivité, mais la facture reste opaque. Les professionnels indépendants comme les consultants et avocats peuvent utiliser l'IA intelligemment — pas sans limites. Et les développeurs marocains peuvent construire de nouveaux outils pour aider les entreprises à contrôler leurs dépenses. Cette opportunité sera énorme dans les années à venir, surtout pour les startups intéressées par la gestion des coûts d'IA.

Articles liés