
Ouvrir les poids d’un modèle d’IA passe encore pour un geste désintéressé, une offrande faite à la communauté. La réalité est plus froide. Derrière la vague de modèles publiés en accès libre ces dernières semaines, chaque acteur poursuit un calcul qui n’a rien à voir avec celui du voisin.
NVIDIA, Cohere, Zyphra, Poolside : ces noms se retrouvent côte à côte dans les sorties open source du moment. On les range volontiers dans la même case, celle des bons élèves de l’ouverture. C’est une erreur de lecture. Ouvrir un modèle est devenu une arme de positionnement, et il vaut la peine de regarder, acteur par acteur, contre quoi cette arme est pointée.
L’open source n’a plus un seul visage
Il y a un an, le paysage des modèles ouverts tenait dans une poignée de noms, chinois pour l’essentiel : DeepSeek, Zhipu, Minimax. La diversité d’aujourd’hui change la donne. Des laboratoires occidentaux comme Poolside, Arcee ou Zyphra côtoient désormais des acteurs souverains comme Cohere, Mistral ou Trillion Labs, et des géants comme NVIDIA ou Google avec sa gamme Gemma.
Cette multiplication n’est pas anecdotique. Elle dit une chose simple : l’ouverture n’est plus portée par un type d’acteur unique, donc par une motivation unique. Et c’est précisément là que la lecture naïve se trompe. Mettre une licence permissive sur des poids ne signifie pas la même chose selon qui appuie sur le bouton.
Frontière contre souveraineté : les fabricants de modèles
Première famille, les fabricants de modèles « purs ». Pour Poolside, Zyphra ou Arcee, l’objectif affiché est de tenir la frontière technique, ou de s’en approcher. Ouvrir, pour eux, c’est exister dans la conversation, attirer les chercheurs et faire valider leurs choix d’architecture par d’autres. Le poids publié est une carte de visite autant qu’un produit.
À côté, une seconde catégorie poursuit un tout autre but : la souveraineté. Cohere, qui revient régulièrement dans les sorties ouvertes, vient de publier son modèle phare Command A+. Mistral ou Trillion Labs jouent la même partition. Ici, ouvrir un modèle, c’est offrir à un État ou à une entreprise une alternative qu’aucun fournisseur étranger ne peut couper du jour au lendemain.
La nuance compte. Les premiers promettent la performance ; les seconds promettent l’indépendance. Deux promesses, deux publics, et au bout du compte deux modèles que rien n’oblige à se ressembler, même rangés dans la même catégorie « open ».
Les géants n’ouvrent pas par philanthropie
Vient la famille la plus instructive : les géants. Quand Alibaba ouvre sa série Qwen, ce n’est pas pour saborder son activité, c’est pour faire monter en gamme ses modèles fermés payants. Quand NVIDIA ouvre, le calcul est encore plus limpide : un écosystème open florissant fait tourner des GPU, et NVIDIA vend des GPU. Le modèle gratuit est l’appât, le métal est le produit.
L’illustration est nette avec NVIDIA-Nemotron-3-Ultra, la grande version de la série Nemotron, qui s’appuie sur une architecture LatentMoE pour aller plus vite que des modèles comparables et dont l’essentiel des données d’entraînement est ouvert. Surtout, NVIDIA abandonne sa licence maison au profit d’OpenMDW, une licence taillée pour les poids de modèles là où des textes comme MIT ou Apache restent des licences logicielles qui ne couvrent pas vraiment des poids. Détail technique ? Pas seulement : c’est un acteur qui rend l’adoption juridiquement plus propre, donc plus large, donc plus consommatrice de calcul.
On est loin de l’ère Llama, où les motivations d’ouverture côté occidental restaient floues et n’ont finalement pas tenu. Ici, l’intérêt commercial est assumé et c’est tant mieux : un open source dont on comprend le moteur économique est un open source plus durable.
Quand le poids n’est qu’un sous-produit
Reste une dernière famille, à part : les entreprises de produit. JetBrains, Zed, Krea ou Photoroom ne vendent pas des modèles, elles vendent des logiciels qui en embarquent. Pour ne pas dépendre d’un fournisseur fermé susceptible de les couper, elles entraînent de petits modèles très spécialisés, taillés pour leur usage.
Et comme leur chiffre d’affaires ne vient pas des poids eux-mêmes, les ouvrir ne leur coûte rien. Pour un fabricant de modèles, le poids est le produit ; pour une entreprise de produit, le poids n’est qu’un sous-produit qu’on peut offrir sans se faire mal. La même décision, ouvrir, recouvre deux économies opposées.
Lire la motivation avant de lire le modèle
La conséquence est directe au moment d’intégrer un de ces modèles dans une application, un agent ou un pipeline de RAG (génération augmentée par la recherche) : la motivation derrière une sortie en dit plus long sur sa pérennité que le score affiché au lancement. Un modèle ouvert pour recruter des chercheurs, un autre ouvert pour vendre du calcul, un troisième ouvert parce qu’il ne rapporte rien de toute façon : aucun des trois n’a la même probabilité d’être maintenu dans deux ans.
Le réflexe à prendre est double. Vérifier la licence, d’abord, car le passage à un texte comme OpenMDW sécurise l’usage commercial là où une vieille licence maison piège l’adoption. Comprendre le calcul de l’éditeur, ensuite, pour anticiper s’il a intérêt à faire vivre son modèle ou à l’abandonner une fois son objectif marketing atteint.
Cette diversité de motivations, loin d’être un désordre, est la force du moteur : les rapports techniques se citent, se réutilisent, empruntent architectures et méthodes d’entraînement d’une sortie à l’autre. Vouloir freiner ou interdire cet écosystème serait non seulement vain, comme l’histoire des interdictions technologiques l’a montré, mais dangereux : cela concentrerait l’IA entre quelques mains. La générosité, ici, n’a jamais existé. C’est la concurrence des intérêts qui tient l’open source debout, et c’est sans doute la meilleure nouvelle pour ceux qui s’en servent.
