
Mardi, Microsoft a changé sa façon de facturer pour la première fois en vingt ans. Derrière ce geste comptable se cache un pari assumé : le forfait logiciel, modèle dominant depuis deux décennies, n’a plus d’avenir face à l’IA agentique. Reste à savoir où mène cette bascule, et à quelle échéance.
Vingt ans de forfait, balayés en un mardi
Le déclencheur s’appelle Copilot Cowork, un agent capable de mener seul des tâches de bureau : rédiger des documents, bâtir des feuilles de calcul, envoyer des courriels. L’outil exige toujours un abonnement Microsoft 365 Copilot, mais chaque tâche qu’il exécute est désormais facturée à part, selon la puissance de calcul consommée.
Pour Charles Lamanna, vice-président exécutif chargé de Copilot et des agents, le calcul est sans appel. Le prix fixe n’est plus tenable, et la facturation à l’usage est « la seule façon de faire fonctionner le modèle économique ». Une rupture qu’il reconnaît lui-même comme « une grande évolution » pour une entreprise dont la bureautique reposait depuis vingt ans sur des abonnements prévisibles.
Le symbole compte autant que la mécanique. Microsoft acte que le compteur remplace le forfait.
Pourquoi l’agent coûte trop cher pour un prix fixe
La raison tient à la nature même de ces agents. Un raisonnement agentique enchaîne les étapes, peut tourner plusieurs heures d’affilée et brûle des tokens à un rythme sans commune mesure avec un moteur de recherche ou un chatbot. Microsoft cite un client qui a comparé près de 4 000 documents en quelques heures : ce genre de charge fait exploser une grille tarifaire unique.
S’ajoute une variabilité extrême d’un utilisateur à l’autre. Lamanna pointe « ceux qui lancent des centaines de tâches par semaine » : impossible de fixer une licence moyenne qui ne ruine pas l’éditeur sur les gros consommateurs ni ne surfacture les petits. À sa disponibilité générale, Cowork s’appuie sur les modèles d’Anthropic, dont Opus 4.8 et Sonnet 4.6, tandis que l’offre « Frontier » donne accès à GPT-5.5. Autant de moteurs coûteux à faire tourner.
Le client devient un compteur
L’image employée par Microsoft résume tout : payer l’IA reviendra à « faire le plein à la pompe ». On consomme, on règle l’addition à la fin. Pour éviter les notes incontrôlées, le service est désactivé par défaut et les entreprises peuvent plafonner la dépense par employé, par équipe ou par département.
Microsoft n’est pas seul sur cette pente. Sa filiale GitHub a basculé son Copilot vers la facturation à l’usage début juin, déclenchant la colère de développeurs qui ont vu leur note grimper d’un coup. Anthropic a annoncé au même moment que ses modèles les plus avancés seraient facturés à l’usage plutôt qu’inclus dans les abonnements, même haut de gamme. Le mouvement n’est pas un caprice de Microsoft, c’est une vague de fond du secteur.
Le levier laissé au client pour alléger la facture : choisir lui-même le modèle, plus ou moins puissant, donc plus ou moins cher.
DeepSeek sur Azure : jusqu’où baisser la note ?
C’est précisément là que se joue le prochain acte. Selon des informations de presse, Microsoft étudie une version auto-hébergée et affinée de DeepSeek V4 comme option à bas coût pour Cowork. Le modèle resterait facultatif, entièrement hébergé sur Azure, les données client demeurant dans le cloud de Microsoft, et serait doté de garde-fous contre les biais. Une décision est attendue dans les prochaines semaines.
Recourir à un modèle chinois pour comprimer les coûts ne va pas de soi, surtout aux États-Unis. Mais la logique est limpide : un agent qui consomme énormément a besoin d’un moteur bon marché pour rester rentable. Microsoft prépare d’ailleurs Cowork 1, un modèle « nettement moins cher » destiné aux tâches courantes.
En toile de fond, Satya Nadella a publié cette semaine un billet plaidant pour un écosystème de modèles que les entreprises pourraient choisir et ajuster selon l’usage et le budget. Lui qui décrit l’IA comme « un métier de consommation » et réclame « des utilisateurs intenses et un usage intense » ne cache plus sa cible.
Le point de bascule des prochaines semaines
La trajectoire se lit déjà. À court terme, le forfait illimité disparaît pour tout ce qui touche aux agents, et le compteur devient la norme côté entreprise, comme il l’est devenu côté développeur avec GitHub. À moyen terme, le pari raisonnable est que, d’ici la fin de l’année, la plupart des agents professionnels du marché seront facturés à l’usage, Google et Amazon ayant déjà engagé leurs propres plateformes dans cette voie.
Reste une condition décisive : la maîtrise de la dépense. Tant que les plafonds et le choix du modèle resteront entre les mains du client, la pompe restera acceptable. Le jour où une mauvaise estimation transforme une facture en gouffre, la confiance vacillera, comme l’a montré la grogne des développeurs de GitHub.
Le signal à guetter tient en une décision : si Microsoft valide DeepSeek V4 sur Azure dans les semaines qui viennent, ce sera le marqueur d’une industrie prête à sacrifier le confort géopolitique sur l’autel du coût par token. Ce jour-là, on saura que la facturation à l’usage n’est plus une option, mais le nouveau sol sur lequel se construit tout le logiciel.
