OpenAI s’apprêterait à baisser le prix de ses tokens. Sur le papier, une bonne nouvelle pour quiconque construit avec l’IA. Mais regardez de plus près : ce n’est pas une faveur au développeur, c’est une arme pointée sur le modèle économique d’un concurrent précis.
Baisser le prix, ce n’est pas céder du terrain
Selon des informations de presse, OpenAI étudie une réduction du tarif de ses tokens (l’unité de facturation de l’inférence, c’est-à-dire chaque fragment de texte que le modèle lit ou génère) pour récupérer des clients partis chez Anthropic. L’entreprise s’attend d’ailleurs à ce qu’Anthropic réponde par des baisses similaires.
On pourrait y voir une simple bataille commerciale. Ce serait mal lire la situation. Quand un acteur dominant tire les prix vers le bas dans un marché où tout le monde perd déjà des milliards, il ne cherche pas la rentabilité immédiate. Il cherche à fixer une norme. Et la norme qu’OpenAI veut imposer, c’est que l’inférence est une commodité, un service interchangeable vendu au prix le plus bas possible. Google a d’ailleurs déjà ouvert ce front : lors de sa conférence I/O en mai, il a taillé dans ses tarifs et présente son modèle Gemini Flash comme jusqu’à 70 % moins cher que les modèles concurrents sur certaines charges, fort de ses propres puces maison (TPU) qui l’affranchissent du prix des GPU.
Pourquoi Anthropic est la cible et pas le bénéficiaire
Le calendrier n’a rien d’innocent. Claude Code, l’outil de programmation assistée d’Anthropic, est devenu viral chez les développeurs. Dans la foulée, la startup a dépassé OpenAI en valorisation pour la première fois. Autrement dit : Anthropic gagne sur le terrain le plus stratégique, celui des agents qui écrivent du code et consomment énormément de tokens.
Or le positionnement d’Anthropic repose largement sur le premium : des modèles réputés pour leur fiabilité, vendus à des entreprises prêtes à payer pour cette qualité. Transformer le token en produit à bas coût, c’est attaquer exactement ce socle. Le vrai enjeu n’est pas de savoir qui propose le tarif le plus bas ce trimestre, mais de déterminer sur quel terrain la concurrence va se jouer. OpenAI veut un terrain de prix. Anthropic préférerait un terrain de valeur.
La facture qui a tout changé
Pour comprendre pourquoi le prix du token est devenu le nerf de la guerre, il faut regarder ce qui s’est passé du côté des clients. Lors d’un événement récent, Sam Altman a reconnu que les coûts étaient devenus « un énorme problème » pour les entreprises.
La mutation tient en une bascule de facturation. Les abonnements à tarif fixe ont laissé place à la facturation à l’usage, désormais généralisée chez la plupart des fournisseurs pour leurs offres entreprise. La conséquence est brutale : une même charge de travail qui coûtait 200 dollars par mois peut désormais grimper à plusieurs milliers, voire des dizaines de milliers de dollars.
Cette flambée tient à un enchaînement simple :
- les agents IA s’imposent dans des outils du quotidien comme les assistants de programmation ;
- chaque action d’un agent consomme des tokens, en lecture comme en génération ;
- ces coûts, longtemps masqués par les forfaits illimités, apparaissent désormais en pleine lumière sur la facture.
Le résultat est déjà visible : certains clients entreprise réduisent leurs dépenses en IA. C’est précisément cette sensibilité nouvelle au prix qu’OpenAI cherche à exploiter.
Ce que ça change pour qui orchestre l’IA au quotidien
Pour un praticien qui assemble des agents et pilote des modèles au jour le jour, une baisse de tarif est tentante. Elle mérite pourtant un regard critique.
D’abord, un prix au token plus bas ne dit rien du coût total. Un modèle moins cher mais moins fiable peut exiger plus d’allers-retours, plus de vérifications, plus de tokens consommés pour arriver au même résultat. La vraie métrique n’est pas le prix unitaire, c’est le coût pour accomplir une tâche de bout en bout.
Ensuite, une guerre des prix fragilise ceux qui la mènent. Les deux entreprises creusent déjà des pertes qui se comptent en milliards. Cette semaine, OpenAI a déposé en confidentiel ses documents en vue d’une entrée en Bourse, probablement pas avant 2027. Anthropic a déposé les siens et prévoit de se coter plus tard cette année. Une bataille tarifaire frontale aggraverait ces pertes au moment précis où les marchés vont examiner leurs comptes. Construire son infrastructure sur un fournisseur qui brûle du cash pour casser les prix n’est pas sans risque : les tarifs d’aujourd’hui ne sont pas une promesse pour demain.
Enfin, il y a un piège plus subtil. Si l’inférence devient une commodité, la différenciation se déplace ailleurs : vers les outils, l’intégration, la qualité du modèle sur des tâches précises. Choisir un fournisseur uniquement sur le prix du token, c’est parier que tous les modèles se valent. Ils ne se valent pas.
Commodité ou premium : qui dictera la règle ?
Deux visions s’affrontent en réalité. L’une veut faire du token une matière première indifférenciée, vendue au plus bas. L’autre veut qu’on paie pour la qualité, la fiabilité, l’usage avancé. La baisse de prix qui s’annonce n’est qu’un coup dans cette partie plus large.
Reste à voir si le marché tranchera pour le moins cher ou pour le plus capable. Et si, en tant qu’orchestrateur, vous accepterez de laisser une guerre des marges décider à votre place de l’outil que vous mettez entre les mains de vos agents.