
L’essentiel
- Selon la presse, OpenAI étudie une baisse du prix de ses tokens pour récupérer des clients passés chez Anthropic, et s’attend à une riposte tarifaire de cette dernière.
- La cible est le positionnement premium d’Anthropic, porté par le succès viral de Claude Code, qui a permis à la startup de dépasser OpenAI en valorisation.
- Google a déjà ouvert ce front avec Gemini Flash, présenté comme jusqu’à 70 % moins cher grâce à ses puces maison (TPU).
- En toile de fond, la bascule vers la facturation à l’usage fait grimper certaines charges de 200 dollars à plusieurs milliers par mois, un coût que Sam Altman qualifie d’« énorme problème ».
OpenAI s’apprêterait à baisser le prix de ses tokens. Sur le papier, une bonne nouvelle pour quiconque construit avec l’IA. Mais regardez de plus près : ce n’est pas une faveur au développeur, c’est une arme pointée sur le modèle économique d’un concurrent précis.
Baisser le prix, ce n’est pas céder du terrain
Selon des informations de presse, OpenAI étudie une réduction du tarif de ses tokens (l’unité de facturation de l’inférence, c’est-à-dire chaque fragment de texte que le modèle lit ou génère) pour récupérer des clients partis chez Anthropic. L’entreprise s’attend d’ailleurs à ce qu’Anthropic réponde par des baisses similaires.
On pourrait y voir une simple bataille commerciale. Ce serait mal lire la situation. Quand un acteur dominant tire les prix vers le bas dans un marché où tout le monde perd déjà des milliards, il ne cherche pas la rentabilité immédiate. Il cherche à fixer une norme. Et la norme qu’OpenAI veut imposer, c’est que l’inférence est une commodité, un service interchangeable vendu au prix le plus bas possible. Google a d’ailleurs déjà ouvert ce front : lors de sa conférence I/O en mai, il a taillé dans ses tarifs et présente son modèle Gemini Flash comme jusqu’à 70 % moins cher que les modèles concurrents sur certaines charges, fort de ses propres puces maison (TPU) qui l’affranchissent du prix des GPU.
Pourquoi Anthropic est la cible et pas le bénéficiaire
Le calendrier n’a rien d’innocent. Claude Code, l’outil de programmation assistée d’Anthropic, est devenu viral chez les développeurs. Dans la foulée, la startup a dépassé OpenAI en valorisation pour la première fois. Autrement dit : Anthropic gagne sur le terrain le plus stratégique, celui des agents qui écrivent du code et consomment énormément de tokens.
Or le positionnement d’Anthropic repose largement sur le premium : des modèles réputés pour leur fiabilité, vendus à des entreprises prêtes à payer pour cette qualité. Transformer le token en produit à bas coût, c’est attaquer exactement ce socle. Le vrai enjeu n’est pas de savoir qui propose le tarif le plus bas ce trimestre, mais de déterminer sur quel terrain la concurrence va se jouer. OpenAI veut un terrain de prix. Anthropic préférerait un terrain de valeur.
La facture qui a tout changé
Pour comprendre pourquoi le prix du token est devenu le nerf de la guerre, il faut regarder ce qui s’est passé du côté des clients. Lors d’un événement récent, Sam Altman a reconnu que les coûts étaient devenus « un énorme problème » pour les entreprises.
La mutation tient en une bascule de facturation. Les abonnements à tarif fixe ont laissé place à la facturation à l’usage, désormais généralisée chez la plupart des fournisseurs pour leurs offres entreprise. La conséquence est brutale : une même charge de travail qui coûtait 200 dollars par mois peut désormais grimper à plusieurs milliers, voire des dizaines de milliers de dollars.
Cette flambée tient à un enchaînement simple :
- les agents IA s’imposent dans des outils du quotidien comme les assistants de programmation ;
- chaque action d’un agent consomme des tokens, en lecture comme en génération ;
- ces coûts, longtemps masqués par les forfaits illimités, apparaissent désormais en pleine lumière sur la facture.
Le résultat est déjà visible : certains clients entreprise réduisent leurs dépenses en IA. C’est précisément cette sensibilité nouvelle au prix qu’OpenAI cherche à exploiter.
Un token moins cher ne fait pas une facture plus basse
Pour un praticien qui assemble des agents et pilote des modèles au jour le jour, une baisse de tarif est tentante. Elle mérite pourtant un regard critique.
D’abord, un prix au token plus bas ne dit rien du coût total. Un modèle moins cher mais moins fiable peut exiger plus d’allers-retours, plus de vérifications, plus de tokens consommés pour arriver au même résultat. La vraie métrique n’est pas le prix unitaire, c’est le coût pour accomplir une tâche de bout en bout.
Ensuite, une guerre des prix fragilise ceux qui la mènent. Les deux entreprises creusent déjà des pertes qui se comptent en milliards. Cette semaine, OpenAI a déposé en confidentiel ses documents en vue d’une entrée en Bourse, probablement pas avant 2027. Anthropic a déposé les siens et prévoit de se coter plus tard cette année. Une bataille tarifaire frontale aggraverait ces pertes au moment précis où les marchés vont examiner leurs comptes. Construire son infrastructure sur un fournisseur qui brûle du cash pour casser les prix n’est pas sans risque : les tarifs d’aujourd’hui ne sont pas une promesse pour demain.
Enfin, il y a un piège plus subtil. Si l’inférence devient une commodité, la différenciation se déplace ailleurs : vers les outils, l’intégration, la qualité du modèle sur des tâches précises. Choisir un fournisseur uniquement sur le prix du token, c’est parier que tous les modèles se valent. Ils ne se valent pas.
Commodité ou premium : qui dictera la règle ?
Deux visions s’affrontent en réalité. L’une veut faire du token une matière première indifférenciée, vendue au plus bas. L’autre veut qu’on paie pour la qualité, la fiabilité, l’usage avancé. La baisse de prix qui s’annonce n’est qu’un coup dans cette partie plus large.
Reste à voir si le marché tranchera pour le moins cher ou pour le plus capable. Et si, en tant qu’orchestrateur, vous accepterez de laisser une guerre des marges décider à votre place de l’outil que vous mettez entre les mains de vos agents.
Mon avis
Cette guerre des prix, OpenAI ne peut pas la gagner, parce qu’elle se bat contre la physique économique de Google. Quand vos puces sont des TPU maison et celles de vos rivaux des GPU loués à prix d’or, seul celui qui possède la fonderie transforme le token en commodité sans se saigner. OpenAI croit attaquer Anthropic sur le prix : en réalité, je le vois creuser la tranchée dans laquelle Gemini Flash l’attend déjà. Le vrai gagnant d’une course vers le bas n’est jamais celui qui la déclenche, c’est celui dont la marge survit en bas.
