Meituan se passe de Nvidia pour entraîner LongCat-2.0

L’essentiel

Meituan publie LongCat-2.0, un modèle de 1,6 billion de paramètres avec une fenêtre de contexte d’un million de tokens.
L’entraînement complet et le déploiement à grande échelle ont été réalisés à 100 % sur des superpods à puces ASIC maison, sans GPU Nvidia.
Le modèle est déjà testable sur OpenRouter sous le nom de code Owl Alpha, et il est taillé pour le développement agentique.

Pendant deux ans, le récit était simple : l’embargo américain sur les puces les plus puissantes ralentissait la Chine, qui multipliait les ruses pour mettre la main sur des GPU Nvidia bridés ou détournés. LongCat-2.0, le nouveau modèle géant de Meituan, vient de changer le décor. Ici, plus de contournement. Pas une puce Nvidia dans la boucle, ni pour l’entraînement, ni pour le service à grande échelle.

Le coup mérite qu’on le lise comme tel : non pas une sortie de modèle de plus, mais un déplacement du terrain de jeu.

Un modèle de tout premier rang sans une puce américaine

Sur le papier, LongCat-2.0 a tout d’un poids lourd. 1,6 billion (1 600 milliards) de paramètres, une architecture MoE (mixture of experts, un réseau qui n’active qu’une fraction de ses paramètres à chaque requête) dont environ 48 milliards de paramètres sont actifs, et une fenêtre de contexte d’un million de tokens. Meituan revendique aussi un mécanisme maison, la LongCat Sparse Attention, conçu pour tenir un tel contexte sans exploser les coûts de calcul.

Pourtant, ce qui rend LongCat-2.0 remarquable ne tient pas dans sa fiche technique, mais dans son infrastructure. Meituan affirme que la totalité de l’entraînement, puis le déploiement en production, reposent sur des superpods bâtis autour de puces ASIC (des circuits gravés pour une tâche précise, ici l’IA, par opposition aux GPU polyvalents de Nvidia). Autrement dit : le modèle naît, vit et sert ses réponses sur une pile silicium qui ne doit rien à l’écosystème américain.

Pourquoi maintenant, et contre qui

Le timing n’a rien d’innocent. Tant que les laboratoires chinois entraînaient leurs modèles sur du matériel Nvidia, même dégradé, le gouvernement américain conservait un levier : restreindre l’accès aux puces, c’était garder une main sur le robinet. Une annonce comme celle de Meituan retire le robinet de l’équation.

Et ce n’est pas un laboratoire de recherche pur qui signe le geste, c’est Meituan, un groupe de livraison et de services à la consommation. Le signal est plus large qu’il n’y paraît : entraîner un modèle frontier (de tout premier rang) sur du silicium souverain n’est plus réservé aux champions nationaux estampillés IA. Le savoir-faire diffuse. Pour les fabricants de puces chinois, qui peinaient à convaincre que leur matériel pouvait soutenir un entraînement à grande échelle, c’est une démonstration grandeur nature. Pour Nvidia, dont la Chine représentait un marché stratégique, c’est la confirmation que le verrou se desserre par le bas.

@testingcatalog sur X

La course se déplace vers le silicium

On a longtemps cru que la compétition se jouait sur les poids des modèles : qui aurait le plus de paramètres, le meilleur score sur tel benchmark, la fenêtre de contexte la plus large. LongCat-2.0 rappelle que cette bataille-là n’est que la partie visible.

La partie décisive se joue un cran en dessous, sur la capacité à produire et à faire tourner ces modèles sur sa propre pile matérielle. Un modèle, ça se copie, ça se distille, ça fuite. Une chaîne d’approvisionnement souveraine en puces, c’est autrement plus dur à reproduire, et autrement plus difficile à frapper d’embargo. En misant sur des ASIC plutôt que sur des GPU génériques, la Chine ne cherche pas seulement à se passer de Nvidia : elle parie sur une spécialisation matérielle qui peut, à terme, réduire le coût par token et rendre l’inférence à très long contexte économiquement tenable. Le pari n’est d’ailleurs pas inédit : Google entraîne déjà l’intégralité de son modèle Gemini sur ses propres puces TPU, des ASIC maison, sans le moindre GPU Nvidia. Ce que déplace LongCat-2.0, c’est la géographie de cette autonomie, qui cesse d’être l’apanage des géants américains.

Les systèmes agentiques (des IA capables d’enchaîner des actions de façon autonome) sont les premiers concernés. Un modèle pensé dès l’origine pour le développement agentique, capable d’avaler un million de tokens de contexte sur une infrastructure dont le coût n’est pas indexé sur les tarifs Nvidia, change l’arithmétique. Le prix de l’intelligence à grande échelle cesse d’être dicté par un seul fournisseur de silicium.

Ce qu’il faut surveiller

Restons mesurés : une annonce n’est pas un audit. Meituan communique sur ses propres chiffres, et l’écart entre un entraînement réussi sur ASIC maison et une production industrielle stable, performante et reproductible reste à mesurer. La disponibilité d’Owl Alpha sur OpenRouter va offrir un premier terrain de comparaison concret, hors des argumentaires marketing : les développeurs vont pouvoir tester le modèle sur leurs propres tâches, mesurer la latence sur de longs contextes, juger sa tenue en usage agentique réel.

Trois points méritent qu’on les garde à l’œil dans les semaines à venir : la qualité réelle de LongCat-2.0 face aux meilleurs modèles ouverts, la stabilité et le débit de l’inférence sur ces superpods ASIC, et la capacité de Meituan à tenir ce cap sans béquille américaine sur la durée. Si ces trois cases se valident, l’argument de l’embargo comme frein structurel à l’IA chinoise aura vécu.

Mon avis

Je ne retiens pas le million de tokens ni les 1,6 billion de paramètres : ces chiffres seront dépassés dans six mois. Ce que je retiens, c’est qu’un groupe de livraison de repas vient d’entraîner un modèle frontier sans toucher une puce Nvidia. Le jour où l’autonomie silicium devient banale au point qu’une entreprise non spécialisée la réussit, l’embargo cesse d’être une arme et devient un calendrier : il ne stoppe plus rien, il fixe juste la date à laquelle l’autre s’en affranchit.

Sources

LongCat-2.0

Meituan se passe de Nvidia pour entraîner LongCat-2.0

Un modèle de tout premier rang sans une puce américaine

Pourquoi maintenant, et contre qui

La course se déplace vers le silicium

Ce qu’il faut surveiller

Sources

Un autre article ?

Claude sur Azure : Anthropic joue sur le terrain d’OpenAI

Suno Spark : des artistes pour nourrir sa machine IA

NVIDIA, Cohere, Zyphra : ouvrir une IA, arme ou cadeau ?

Laisser un commentaire Annuler la réponse