
L’essentiel
- OpenAI annonce Jalapeño, sa première puce d’IA, conçue en interne et mise en production avec Broadcom.
- Le silicium est taillé spécifiquement pour l’inférence des LLM qui font tourner ChatGPT, Codex, l’API et les futurs produits agentiques.
- L’enjeu n’est pas de battre Nvidia sur la performance brute, mais de reprendre la main sur le coût et la disponibilité du calcul.
OpenAI vient d’annoncer Jalapeño, sa première puce d’IA, conçue de bout en bout en interne et fabriquée avec Broadcom. La communication officielle insiste sur un point précis : ce silicium est pensé pour les charges d’inférence des grands modèles, celles qui alimentent ChatGPT, Codex et l’API.
Derrière l’objet technique, c’est un coup sur l’échiquier. Et la cible se devine sans peine.
Une puce d’inférence, pas une puce d’entraînement
Le détail compte. OpenAI ne dit pas avoir construit un rival des GPU haut de gamme pour entraîner ses modèles. Il dit avoir conçu une puce pour les faire tourner, une fois entraînés. L’inférence, c’est le calcul qui se déclenche à chaque requête, des millions de fois par jour, et qui pèse aujourd’hui l’essentiel de la facture d’un service grand public.
Entraîner un modèle coûte cher une fois. Le servir coûte cher en permanence. À l’échelle de ChatGPT, chaque point de marge sur le coût par requête se compte en centaines de millions. C’est précisément là que Jalapeño vient se loger : non pas sur la prouesse, mais sur la dépense récurrente.
Le rapport de force avec Nvidia
Officiellement, OpenAI ne déclare la guerre à personne. Dans les faits, l’entreprise dépend depuis ses débuts des accélérateurs Nvidia, dont elle est l’un des plus gros clients au monde. Cette dépendance a un prix, une file d’attente, et un fournisseur unique qui dicte ses conditions.
Concevoir son propre silicium, c’est se donner une carte à abattre à la table de négociation. Même si Jalapeño ne remplace qu’une fraction du parc, sa seule existence change l’équilibre : OpenAI cesse d’être un client captif. La menace crédible d’une alternative interne vaut souvent plus que l’alternative elle-même.
Le choix de Broadcom n’est pas neutre non plus. Le fondeur s’est imposé comme le partenaire des géants qui veulent leur silicium maison sans s’embarquer dans une usine : il co-conçoit déjà les TPU de Google, le MTIA de Meta et la puce Maia de Microsoft. OpenAI rejoint un club où l’on ne sous-traite plus son calcul, on le co-conçoit.
L’intégration verticale comme arme
Ce que dessine Jalapeño, c’est une descente dans la pile technique. OpenAI possède déjà les modèles, les produits et l’API. En s’emparant de la couche matérielle qui exécute ces modèles, l’entreprise referme la boucle : du transistor à l’interface, tout reste maison.
Cette intégration verticale a un effet direct sur le calcul agentique, ce moment où un modèle ne répond plus en une fois mais enchaîne des dizaines d’étapes, d’appels d’outils et de raisonnements. Un agent consomme bien plus d’inférence qu’un simple chatbot. Optimiser le silicium pour ce profil de charge, c’est préparer le terrain des produits qui n’existent pas encore mais qui sont déjà annoncés.
Une puce taillée pour ses propres modèles peut viser une efficacité qu’un accélérateur généraliste ne cherche pas. Moins de fonctions inutiles, une architecture mémoire calée sur les besoins réels d’un LLM en production. Le gain ne se mesure pas en téraflops affichés, mais en coût par million de jetons servis.
Prix et disponibilité : l’effet sur l’écosystème
Côté écosystème, un silicium maison agit directement sur deux variables décisives : le prix et la disponibilité de l’API. Si OpenAI maîtrise son coût d’inférence, il dispose d’une marge pour baisser ses tarifs ou, au contraire, pour tenir ses prix tout en encaissant la demande agentique qui explose.
La disponibilité compte tout autant. Les pénuries de capacité ont déjà rationné l’accès à certains modèles. Un parc de puces sous contrôle interne, c’est une promesse de stabilité que le seul Nvidia ne pouvait pas garantir. Reste une dépendance qui se déplace : on ne dépend plus du GPU d’un tiers, mais du bon vouloir d’un fournisseur encore plus intégré.
Le revers, c’est l’enfermement. Plus OpenAI verrouille sa pile, plus l’écosystème qui en vit s’arrime à ses choix techniques, ses formats et son calendrier. La souveraineté que l’entreprise gagne sur son calcul, ses clients la perdent un peu sur le leur.
Un signal pour tout le secteur
Jalapeño n’est pas un cas isolé, c’est l’aboutissement d’une logique. Les grands acteurs de l’IA ont compris que la valeur ne tient pas seulement dans le modèle, mais dans la chaîne complète qui le produit et le sert. Celui qui contrôle le silicium contrôle le coût, et celui qui contrôle le coût fixe les règles du marché en aval.
La course aux modèles se double désormais d’une course au calcul. Et dans cette seconde course, le silicium maison devient le ticket d’entrée pour rester maître de ses marges quand l’inférence agentique deviendra le poste de dépense numéro un.
Mon avis
Je ne lis pas Jalapeño comme une rupture technologique mais comme un acte de pouvoir. OpenAI ne cherche pas à humilier Nvidia sur un benchmark, il se construit un levier de négociation et une assurance contre la pénurie. Le vrai gagnant à moyen terme sera celui qui maîtrisera le coût de l’inférence agentique, et OpenAI vient de prendre une longueur d’avance que ses concurrents purement logiciels n’ont pas. Le prix à payer, on le découvrira plus tard : un écosystème qui dépend d’un acteur désormais intégré du transistor jusqu’à l’agent.
