
Une banque d’affaires parle de « signaux d’euphorie », et le mot tombe aussitôt : bulle. Tout le monde y voit un remake de l’an 2000, avec les semi-conducteurs dans le rôle des valeurs internet. Sauf que le rapport de J.P. Morgan dit autre chose, et c’est nettement plus dérangeant.
Ce que tout le monde retient : un air de 2000
La lecture facile est servie sur un plateau. J.P. Morgan note que le rallye des puces dessine des figures techniques très proches de la bulle dotcom. Les valeurs de semi-conducteurs s’écartent de leur moyenne mobile à 200 jours aussi brutalement qu’à l’époque. Les hedge funds n’ont jamais été aussi exposés aux fabricants de puces. Les prêts sur marge en Corée ont triplé depuis 2020, et le volume d’options sur les semi-conducteurs vaut cinq fois celui de 2020.
Ajoutez que les ETF à effet de levier sur les puces (des fonds qui amplifient les variations de cours) ont quintuplé leur poids sur les marchés mondiaux depuis début 2024, et le récit s’écrit tout seul. C’est précisément cette partie que tous les commentaires reprennent. Et c’est celle qui compte le moins.
Le signal qui dérange : la concentration, pas le cours
Le cœur du document de J.P. Morgan n’est pas une question de valorisation, mais de structure. Depuis le lancement de ChatGPT fin 2022, seulement 42 entreprises liées à l’IA du S&P 500 (l’indice des 500 grandes capitalisations américaines) ont porté à elles seules 65 à 80 % des profits, des revenus et des investissements de tout l’indice.
Autre chiffre qui glace : les dix plus grosses valeurs américaines pèsent désormais environ 40 % de la capitalisation du S&P 500. En 2015, c’était 17 %. La banque relativise, et c’est honnête de sa part : à l’échelle mondiale, le marché américain reste parmi les moins concentrés, seuls l’Inde et le Japon faisant mieux. Mais le mouvement, lui, va dans un seul sens.
Le professeur de finance Aswath Damodaran (université de New York) prévient dans le même esprit qu’un décrochage de l’IA pourrait frapper plus fort que l’éclatement de la bulle internet. La raison n’est pas que les cours sont hauts. C’est que tout l’édifice repose sur quelques piliers. Quand l’indice tient à une poignée de noms, leur faiblesse devient celle de tout le monde.
La dépendance au silicium commence à se fissurer
Cette concentration ne s’arrête pas aux marchés financiers. Elle s’étend à l’infrastructure même de l’IA, et c’est là que le sujet devient technique. Nvidia conserve la plus grosse part du marché des accélérateurs (les puces spécialisées qui font tourner les charges IA), mais elle s’effrite : de 85 % en 2023 à environ 75 % attendus en 2026, selon J.P. Morgan.
La cause est limpide pour qui regarde les coûts. Les puces maison des grands fournisseurs de cloud, les TPU de Google ou les Trainium d’Amazon, réduisent les coûts d’exploitation de 30 à 40 % par rapport aux GPU de Nvidia. Anthropic s’est ainsi engagé à faire tourner son IA Claude sur les Trainium d’Amazon pour les dix prochaines années. Quand un laboratoire de premier plan signe une décennie de calcul ailleurs que chez le leader, ce n’est pas un détail comptable.
Même logique côté modèles. La hausse du prix des tokens (les unités de texte facturées à chaque requête) pousse déjà les entreprises à basculer des tâches vers des modèles moins chers. Le prix moyen du token baisse, et les modèles open-source chinois approchent les performances du haut de gamme pour une fraction du coût. La dépendance à un fournisseur unique, qu’il s’agisse de puces ou de modèles, devient un pari, pas une évidence.
La portabilité entre modèles n’est plus un luxe
Le risque décrit par J.P. Morgan se mesure en dépendances empilées : un marché qui tient à 42 noms, une infrastructure qui tient à un fournisseur de puces, des laboratoires dont les revenus grimpent vite mais dont les coûts de calcul restent massifs et la rentabilité incertaine. Trois couches de concentration qui se renforcent l’une l’autre.
Pour une entreprise qui bâtit son produit sur ces briques, la leçon est concrète. Verrouiller toute une architecture sur un seul modèle propriétaire, c’est importer cette fragilité chez soi. La diversité d’approvisionnement, hier réservée aux directions achats, devient une décision d’ingénierie : prévoir une portabilité entre modèles, mesurer son coût réel au token, garder une voie de repli vers l’open-source.
Les chiffres le confirment déjà : la part des investissements technologiques dans la croissance économique monte, pendant que les marges de free cash flow (la trésorerie disponible après dépenses) des grands acteurs du cloud se réduisent et que leur dette enfle. L’argent se concentre au moment précis où les marges s’amincissent.
Le rapport ne se résume donc pas à un cours de Bourse qui clignote en rouge. Ce qu’il décrit, c’est une dépendance silencieuse, à des puces, à des modèles, à une poignée d’entreprises, qui s’installe pendant qu’on regarde ailleurs. Surveillez moins les graphiques que vos propres points d’appui : ce sont eux qui décideront si une secousse du marché reste une nouvelle financière ou devient votre problème d’architecture.
