421 produits open source face au mur des modèles fermés

421 produits open source face au mur des modèles fermés

Une fondation née à Paris a entrepris de dresser la carte du monde de l’IA ouverte. Son premier jet recense 421 produits documentés en profondeur. Le nombre paraît solide, précis, presque rassurant, jusqu’au moment où on le met en face de tout ce qu’il laisse dehors.

Ce chiffre vient de Current AI, présentée comme « un partenariat mondial pour construire une option publique de l’IA », lancée comme organisation à but non lucratif lors de l’AI Action Summit de février 2025 et adossée à 400 millions de dollars déjà engagés. Fin juin, l’initiative a publié sa Gap Map v0.1, une tentative d’indexer l’état réel de l’IA open source. Brandi seul, 421 ne dit pourtant pas grand-chose : tout se joue dans ce qu’il retient et, surtout, dans la masse restée hors champ.

D’où sort ce 421

Le détail est public, et il mérite qu’on s’y arrête. Les 421 produits se répartissent en 266 outils et bibliothèques logicielles, 85 modèles, 50 jeux de données et 20 projets matériels, issus de 228 organisations. Le tout est rangé dans 14 catégories réparties sur trois couches de la pile : composants de modèle, produit et expérience utilisateur, infrastructure.

Autrement dit, 421 n’est pas un inventaire de l’écosystème. C’est un échantillon trié à la main, celui que la fondation a jugé assez important pour être documenté, noté et cité. Les données brutes sont d’ailleurs ouvertes sous licence MIT sur le dépôt GitHub currentai-org/os-ai-map : 1 184 fichiers YAML, plus les carnets, schémas et scripts de collecte. On peut vérifier soi-même. Cette transparence est déjà, en soi, une prise de position.

421 documentés, 24 400 laissés de côté

Regardons l’ordre de grandeur. À côté des 421 produits passés au crible, la carte reconnaît 24 400 autres artefacts non classés : une longue traîne laissée sans note tant qu’elle n’a pas été étudiée et sourcée. Et pour repérer ces objets, le projet suit déjà 16 185 dépôts GitHub, disponibles en un simple fichier CSV.

Mettez ces trois nombres côte à côte. Le travail fin porte sur environ 1,7 % du champ que la fondation elle-même a placé sous surveillance. Ce n’est pas un reproche : documenter un produit sérieusement, avec ses dépendances et ses licences, coûte cher en heures humaines. Mais cela change la lecture. 421 renseigne moins sur la taille de l’IA ouverte que sur la portion qu’on a eu le temps d’examiner de près. Le reste existe, tourne, se déploie, sans qu’on sache encore le situer.

85 modèles, et le silence au sommet

La ventilation par couche est encore plus parlante que le total. Sur 421 produits, seuls 85 sont des modèles. Le gros du corpus, ce sont des outils : bibliothèques d’entraînement, frameworks de service, briques d’inférence, tuyauterie. La couche applicative et l’outillage sont abondants ; la couche des modèles de base, elle, est mince.

Ce déséquilibre n’a rien d’un hasard. Il dessine la géographie réelle du pouvoir dans l’IA d’aujourd’hui. Là où l’open source foisonne, c’est autour des modèles : pour les servir, les affiner, les orchestrer, les brancher sur du RAG (génération augmentée par la récupération de documents). Là où il se raréfie, c’est au cœur, sur les grands modèles de fondation eux-mêmes, ceux qui décident de ce qu’un système sait faire. Et ce cœur, ce sont très majoritairement des systèmes fermés qui l’occupent.

La carte de Current AI, en creux, pointe donc l’endroit exact de la dépendance. Un praticien peut assembler une pile entièrement ouverte pour tout ce qui entoure le modèle. Mais au centre, il finit le plus souvent par appeler l’API d’un laboratoire privé. Ce centre fermé, trois acteurs le tiennent : OpenAI, Google et Anthropic, dont les modèles concentrent l’essentiel des usages, plus de neuf visites sur dix parmi les grands assistants du marché. Les 336 outils qui gravitent autour des 85 modèles sont autant de preuves que la communauté sait construire partout, sauf peut-être là où ça compte le plus.

Les cases vides valent mieux que le total

Un ingénieur qui assemble une pile d’IA n’a que faire de la ligne « 421 » à exhiber en réunion. Ce qui l’intéresse, c’est la liste des cases vides. Chaque catégorie sous-peuplée est un signal de fragilité, un maillon où son système repose sur une brique fermée, sans équivalent libre mûr pour prendre le relais si les conditions d’accès changent du jour au lendemain.

La démarche a ses limites, et la fondation ne les cache pas. Une v0.1 reste un premier jet ; 1,7 % du champ documenté, cela veut dire que la hiérarchie des priorités appartient encore à ceux qui tiennent le stylo. Un projet européen, financé pour promouvoir une option publique, dresse la carte de sa propre bataille : il faut lire ces chiffres en gardant à l’esprit d’où ils parlent. Mais la matière est ouverte, vérifiable, rejouable. On peut la contester avec ses propres données.

L’apport tient dans ce renversement de regard : on cherchait un palmarès de l’IA libre, on hérite d’une carte de ses manques. Et ces manques désignent l’endroit précis où se joue la souveraineté technique : au centre, sur cette poignée de modèles de fondation restés fermés que personne n’a encore su rouvrir. Les milliers d’outils qu’on sait déjà écrire tout autour n’y changent rien.

Sources

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *