
+27 %. C’est, selon Anthropic, la hausse en six mois (octobre → avril) du prix qu’un freelance facturerait pour la tâche moyenne traitée dans une session de Claude Code. Pas une hausse de consommation de tokens, pas un volume d’usage : le prix de la prestation équivalente sur le marché. L’éditeur a comparé le travail réalisé dans chaque session à ce que la même tâche coûterait sur une place de marché de freelances. Et ce déplacement de la mesure mérite qu’on s’y arrête plus que le pourcentage lui-même.
D’où sort ce chiffre, au juste ?
Le +27 % vient de la dernière publication de recherche économique d’Anthropic, qui propose un cadre pour suivre l’évolution de Claude Code, son assistant de programmation en ligne de commande. La méthode est inhabituelle : plutôt que de compter des requêtes ou des lignes de code générées, l’équipe a estimé le prix qu’aurait une tâche si elle était confiée à un développeur indépendant.
Autrement dit, on ne mesure plus l’outil par ce qu’il consomme, mais par ce qu’il remplace. C’est un changement d’unité de compte discret mais lourd de sens. Un assistant qui traite des tâches à 5 dollars et un assistant qui traite des tâches à 200 dollars peuvent afficher le même nombre de sessions ; leur valeur économique n’a rien à voir.
Ce que le pourcentage mesure vraiment
+27 % en six mois, ce n’est pas la performance brute du modèle qui progresse de 27 %. C’est la valeur-marché de la tâche moyenne déléguée qui monte. La nuance est essentielle : ce chiffre agrège deux mouvements distincts.
- Les modèles encaissent des tâches plus complexes, donc plus chères à sous-traiter à un humain.
- Les utilisateurs, eux, osent confier davantage : ils montent en gamme dans ce qu’ils délèguent à mesure qu’ils prennent confiance.
Impossible, depuis l’extérieur, de démêler la part de chacun. Mais le sens du mouvement est clair : la frontière de ce qu’on accepte de confier à une IA recule, et elle recule vite. Six mois pour gagner plus d’un quart de valeur, à l’échelle d’un outil de production, c’est une pente raide.
L’écart entre métiers tient en sept points
Anthropic a aussi comparé les taux de réussite de Claude Code selon les métiers. Sur sa mesure la plus exigeante du succès, celle qui réclame une preuve vérifiable qu’un objectif a bien été atteint, par exemple du code qui passe les tests, l’écart entre tous les domaines tient dans moins de 7 points de pourcentage.
Sept points, c’est étroit. Cela signifie que la réussite ne dépend pas tant du secteur d’activité que de la façon dont on pilote l’outil. L’éditeur observe d’ailleurs que les experts d’un domaine, repérés à la précision de leurs questions et à leur vocabulaire, réussissent davantage. Mais l’écart entre un utilisateur intermédiaire et un expert reste modeste.
Pour qui orchestre l’IA au quotidien, c’est la donnée la plus actionnable du rapport. Elle suggère qu’une bonne partie du gain de réussite se joue dans la formulation, pas dans des années d’expertise. La compétence transférable, ici, c’est savoir cadrer une demande.
Ce que le +27 % laisse dans l’ombre
Un chiffre d’autorité reste un chiffre maison. La valeur freelance d’une tâche est une estimation, calée sur des grilles de prix qui varient selon les pays, les plateformes et les périodes. Convertir « j’ai débogué une fonction » en « 80 dollars de prestation » relève d’une modélisation, pas d’un relevé comptable. Le pourcentage est solide en tendance, plus fragile en valeur absolue.
Autre angle mort : une tâche déléguée n’est pas une tâche réussie. Le rapport sépare bien les deux, mais le titre marketing, lui, retient la valeur déléguée. Entre ce qu’on confie à Claude Code et ce qui ressort réellement utilisable, il reste l’étape de vérification, qui demeure humaine. La preuve « vérifiable » exigée dans la mesure stricte rappelle que tout n’est pas validé d’office.
Pourquoi cet indicateur compte maintenant
Anthropic annonce vouloir intégrer certaines de ces mesures à son Indice économique, son observatoire de l’impact de l’IA sur le travail. L’enjeu dépasse Claude Code : si l’on commence à exprimer le travail délégué à une IA en équivalent salarial ou en équivalent freelance, on se dote d’un thermomètre de la substitution, métier par métier. OpenAI explore la même question par un autre biais avec GDPval, qui note la qualité des livrables d’un modèle face à des professionnels plutôt que la valeur des sessions réellement menées.
C’est là que le +27 % prend toute sa portée. Pris isolément, c’est une statistique produit flatteuse. Suivi dans le temps, c’est une courbe : celle de la vitesse à laquelle la valeur économique d’un poste de travail bascule de l’humain vers la machine. La prochaine livraison de cet indice en dira bien plus que le pourcentage d’aujourd’hui, parce qu’elle donnera une pente, et une pente se prolonge.
