Anthropic, Samsung et la puce IA qui vise les marges de Nvidia

L’essentiel

Selon des informations de presse, Anthropic discute avec Samsung Electronics de la fabrication d’une puce IA maison, projet encore à un stade précoce.
Anthropic minimise et assure que les puces d’AWS, Google et Nvidia restent au cœur de sa stratégie, sans commenter de feuille de route propre.
Le laboratoire a recruté Clive Chan, membre des premières équipes silicium de Tesla et d’OpenAI, pour bâtir un groupe dédié.

Un laboratoire d’IA qui commence à dessiner sa propre puce ne le fait pas par goût du matériel. Il le fait parce que quelqu’un, quelque part, capte une marge qu’il aimerait garder. Anthropic discuterait avec Samsung Electronics de la fabrication d’un composant maison, d’après des informations de presse : le projet serait encore embryonnaire, sans design arrêté, sans cible de puissance définie. Sur le papier, presque rien. Dans la partie qui se joue, presque tout.

Un démenti calibré pour ménager AWS et Google

La réaction d’Anthropic mérite qu’on s’y arrête. Le laboratoire relativise l’affaire et répète que les puces d’AWS, de Google et de Nvidia demeurent centrales dans sa stratégie. Il refuse de commenter une quelconque feuille de route silicium qui lui serait propre. Ni oui, ni non : la posture classique de qui prépare un coup sans vouloir l’éventer auprès de ses fournisseurs.

Car ces fournisseurs sont aussi des partenaires stratégiques et des investisseurs. Amazon et Google ont mis des milliards dans Anthropic et lui vendent de la capacité de calcul. Annoncer trop fort qu’on veut s’affranchir de leur matériel reviendrait à mordre la main qui alimente les serveurs. D’où le calibrage millimétré du message : on continue d’acheter, on garde juste une porte ouverte pour, un jour, moins dépendre.

De Jalapeño à Samsung, le même calcul

Le mouvement d’Anthropic ne sort pas de nulle part. OpenAI vient de dévoiler « Jalapeño », sa première puce d’inférence conçue en interne avec Broadcom. AWS, Google et Meta font tourner depuis des années leur propre silicium taillé pour les charges d’IA. Anthropic serait donc le dernier grand nom à rejoindre un club où chaque acteur sérieux finit par concevoir la sienne ; la seule inconnue reste le calendrier.

La logique est brutale et parfaitement lisible. Celui qui construit et exploite son infrastructure d’IA moins cher que les autres conserve une plus grande part du revenu. Or aujourd’hui, une fraction massive du coût d’un modèle part chez Nvidia, dont les GPU (processeurs graphiques) se vendent avec des marges que peu d’industries connaissent. Concevoir sa propre puce, c’est tenter de récupérer cette marge au lieu de la verser à un tiers.

Le recrutement de Clive Chan confirme le sérieux de l’intention. Cet ingénieur a fait partie des premières équipes silicium de Tesla, puis d’OpenAI. On ne débauche pas ce profil pour un prototype de laboratoire. On le recrute pour monter une vraie division matérielle et l’inscrire dans la durée.

L’inférence, là où l’argent se gagne

L’enjeu se joue surtout au déploiement. La bataille se déplace de l’entraînement vers l’inférence, c’est-à-dire le moment où le modèle répond, des milliards de fois par jour. C’est là que le coût s’accumule, requête après requête, et c’est précisément ce que vise « Jalapeño » chez OpenAI comme, vraisemblablement, le projet d’Anthropic.

@C_Barraud sur X

Une puce d’inférence maison, optimisée pour ses propres modèles, change l’équation économique de bout en bout. Elle permet de baisser le prix au token (l’unité de texte facturée), donc d’ouvrir des usages aujourd’hui trop coûteux : agents qui tournent en continu, pipelines qui rappellent le modèle des dizaines de fois par requête, applications grand public à très gros volume. Qui maîtrise son silicium peut se permettre une politique tarifaire qu’un concurrent captif de Nvidia ne peut pas suivre.

C’est là que se dessine la véritable ligne de fracture du secteur. La barrière à l’entrée de l’IA n’est plus seulement le talent des chercheurs ni la taille des jeux de données. Elle devient industrielle : disposer de sa chaîne de calcul, des fonderies aux data centers. Un nouveau venu sans capacité à internaliser son matériel démarrera avec une structure de coûts défavorable, peu importe la qualité de ses modèles.

Un pari industriel loin d’être gagné

Reste que dessiner une puce et la faire fabriquer par Samsung ne garantit rien. Le cycle de conception d’un composant se compte en années, les erreurs coûtent des centaines de millions, et l’écosystème logiciel de Nvidia, avec CUDA, sa plateforme maison, reste un fossé que personne n’a comblé. Anthropic part tard, sur un projet qu’il décrit lui-même comme flou.

Le choix de Samsung plutôt que du taïwanais TSMC, fondeur attitré de la plupart des puces d’IA, mérite aussi qu’on le surveille : il pourrait signaler une recherche de capacité disponible autant qu’une volonté de ne pas dépendre d’un unique fournisseur, exactement le raisonnement qui pousse à quitter Nvidia. La dépendance qu’on fuit à un endroit, on risque de la recréer à un autre.

Ce qui se joue dépasse donc largement une rumeur de composant. C’est le moment où les laboratoires d’IA cessent de se penser comme des éditeurs de logiciels pour se comporter en industriels du calcul. Anthropic ne dit pas encore qu’il fabrique une puce. Il dit surtout qu’il ne peut plus se permettre de ne pas y penser.

Mon avis

Je ne crois pas une seconde au « rien à signaler » d’Anthropic. On ne recrute pas un architecte silicium venu de Tesla et d’OpenAI pour ranger un tiroir. Tout se joue sur l’endurance : le laboratoire trouvera-t-il les milliards et la patience pour tenir un cycle matériel de plusieurs années, face à un Nvidia qui verrouille encore le logiciel avec CUDA ? Mon pronostic : un composant d’inférence modeste d’ici deux ans, taillé pour ses seuls modèles, pas un rival frontal du GPU. De quoi grignoter sa facture, pas renverser la table.

Anthropic, Samsung et la puce IA qui vise les marges de Nvidia

Un démenti calibré pour ménager AWS et Google

De Jalapeño à Samsung, le même calcul

L’inférence, là où l’argent se gagne

Un pari industriel loin d’être gagné

Sources

Un autre article ?

Google : +37 % d’électricité, l’IA bute sur le réseau

Neo défie Microsoft avec une IA qu’on peut remplacer

Téléphone IA de Musk : le coup pour doubler Apple

Laisser un commentaire Annuler la réponse