Quand l’IA coûte plus que les salaires : Lindy lâche Claude

Quand l'IA coûte plus que les salaires : Lindy lâche Claude

Un chiffre résume la bascule : chez Lindy, la facture d’inférence avait fini par dépasser la masse salariale. Pour une équipe de 25 personnes, l’addition des modèles coûtait plus cher que les humains qui les pilotent. Son patron, Flo Crivello, a tranché : exit Claude, bonjour Deepseek. Économie annoncée : plusieurs millions.

Le chiffre qui fait basculer une startup

« Insoutenable. » Le mot est de Crivello lui-même, qui raconte à CNBC une courbe de coûts « écrasée au sol » après la migration. Arrêtons-nous sur la donnée centrale, car c’est elle qui porte toute l’histoire : l’inférence (le coût de chaque requête envoyée au modèle) excédait la paie de l’équipe.

Pour une structure de 25 salariés, la masse salariale tourne, ordre de grandeur, autour de quelques millions de dollars par an. Dire que l’IA passe devant, ce n’est pas une coquetterie comptable. C’est le premier poste de dépense d’une entreprise qui bascule du côté logiciel. Voilà ce que mesure ce chiffre : non pas le prix d’un abonnement, mais le coût marginal d’un produit dont chaque utilisateur consomme des tokens (les unités de texte facturées par le modèle) en continu.

Ce que le chiffre masque : la revente de tokens

Lindy vend des agents (des assistants logiciels qui enchaînent des actions seuls). Or un agent ne fait pas un appel au modèle, il en fait des dizaines par tâche : il lit, planifie, appelle un outil, relit, corrige. Sam Altman, patron d’OpenAI, l’a reconnu récemment : le passage aux systèmes agentiques est devenu un « énorme problème » de coûts, parce qu’ils brûlent les tokens à un rythme inédit.

D’où le point aveugle. Pour une entreprise qui revend de l’intelligence, le tarif au token n’est pas une ligne parmi d’autres : c’est son coût des marchandises vendues. Si le prix d’achat du modèle grimpe plus vite que ce qu’elle facture, sa marge s’évapore. Le chiffre de Lindy ne dit pas « Claude est trop cher dans l’absolu ». Il dit « Claude est trop cher pour mon économie unitaire à moi ».

Que vaut vraiment l’écart de prix ?

Reste la question de la qualité : Deepseek vaut-il Claude ? Sur ce terrain, une analyse du directeur technique de Snowflake apporte un ordre de grandeur utile. Les modèles chinois abordables, comme GLM-5.2, n’égalent pas tout à fait Claude. Mais ils restent compétitifs et l’emportent nettement sur le rapport prix-performance, selon la tâche.

Traduisons. Sur un benchmark (un test de référence), Claude garde l’avantage. Dans un tableur de coûts, l’écart de qualité ne pèse plus le même poids dès lors qu’on le rapporte à un prix parfois plusieurs fois inférieur. La décision n’est plus « quel est le meilleur modèle ? » mais « quel est le modèle juste assez bon, au prix qui me laisse une marge ? ». Pour beaucoup d’usages agentiques répétitifs, le second calcul gagne.

Détail qui compte dans ce dossier : le Deepseek retenu par Lindy est hébergé par une entreprise américaine, sur sol américain. La crainte habituelle sur les modèles chinois (où vont les données ?) se trouve donc neutralisée par le choix d’hébergement. Un frein de moins à la migration.

Le talon d’Achille d’Anthropic est tarifaire

Anthropic affiche une croissance explosive et la qualité de Claude n’est pas contestée, y compris par ceux qui le quittent. Le risque est ailleurs. Crivello a été limpide : il reviendrait si Anthropic baissait ses prix. « C’est une question de survie pour l’entreprise. » La fidélité au meilleur modèle ne résiste pas à une équation de marge négative.

C’est là le point sensible. L’avantage d’Anthropic se mesure en intelligence par token ; sa vulnérabilité se mesure en dollars par token. Tant que des alternatives « assez bonnes » divisent la facture, une partie de la clientèle la plus consommatrice (les startups qui revendent de l’IA, justement celles qui grandissent le plus vite) a un intérêt mécanique à partir dès que le delta de qualité ne justifie plus le surcoût.

Ce qu’il faut surveiller si vous construisez sur un modèle

La leçon dépasse le cas Lindy. Bâtir un produit sur une API de modèle (l’interface technique d’un fournisseur), c’est s’exposer à un coût qui suit votre succès : plus vous avez d’utilisateurs actifs, plus la facture enfle, alors qu’un logiciel classique voit son coût marginal tendre vers zéro. Quelques réflexes concrets pour ne pas se faire surprendre.

  • Mesurez votre coût par tâche, pas par requête : un agent multiplie les appels, c’est le total par action utilisateur qui compte.
  • Gardez votre code agnostique au modèle, pour pouvoir changer de fournisseur sans tout réécrire le jour où la marge se tend.
  • Routez selon la difficulté : un modèle premium pour les tâches qui l’exigent, un modèle bon marché pour le volume répétitif.
  • Testez la qualité sur vos cas, pas sur des classements généraux : l’écart Claude / alternative dépend fortement de votre usage.

Le cas Lindy n’est pas un verdict sur Claude. C’est un rappel que, dans l’économie agentique, le prix au token est devenu un paramètre de survie autant qu’un poste de dépense. Le prochain front de la guerre des modèles ne se jouera peut-être pas sur le benchmark, mais sur le coût unitaire que chaque éditeur acceptera de concéder pour garder les clients qui consomment le plus.

Sources

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *