Meta rejoint GPT-5.5, ses agents IA restent à quai

Meta rejoint GPT-5.5, ses agents IA restent à quai

Il y a des journées où une entreprise se contredit à voix haute. Jeudi, lors d’une réunion interne, Meta a tenu deux discours en apparence inconciliables. D’un côté, Alexandr Wang, patron de sa division intelligence artificielle, a assuré que le nouveau modèle maison, nom de code Watermelon, se hisse au niveau de GPT-5.5, le modèle phare d’OpenAI. De l’autre, Mark Zuckerberg a admis devant ses équipes que le développement des agents IA n’avait pas « accéléré » comme il l’espérait.

Ces deux phrases n’ont rien d’anecdotique. Mises côte à côte, elles disent où se joue désormais la compétition : plus vraiment sur le score au benchmark, mais sur la capacité d’un modèle à agir seul.

D’un côté la parité annoncée, de l’autre l’aveu

Regardons les deux affirmations en vis-à-vis. La première est une promesse de rattrapage : Watermelon, successeur du modèle interne Avocado (le nom de code de Muse Spark, premier modèle de la série lancé en avril), s’entraîne sur une puissance de calcul très supérieure et rivaliserait avec GPT-5.5. Si l’évaluation de Wang tient, Meta aurait comblé une partie de son retard sur le terrain classique de la performance brute.

La seconde est un constat d’échec relatif, et il porte sur autre chose. Zuckerberg n’évoque pas ses modèles fondation, il parle des agents : ces systèmes censés enchaîner des tâches sans supervision constante. Là, l’avancée traîne. Le PDG a même reconnu que les bénéfices de la nouvelle organisation centrée sur l’IA n’étaient pas encore « au rendez-vous », tout en promettant des progrès dans les trois à six mois.

Un modèle qui rejoint la concurrence, des agents qui déçoivent. La contradiction n’est qu’apparente : elle décrit deux disciplines différentes qu’on a longtemps confondues.

Le benchmark, un terrain que Meta sait travailler

Sur les modèles de base, Meta a des armes connues. De la puissance de calcul, beaucoup, et un budget d’infrastructure que peu peuvent aligner : l’entreprise a prévenu ses investisseurs qu’elle dépenserait entre 125 et 145 milliards de dollars cette année en puces, centres de données et infrastructures. À ce niveau de dépense, atteindre la parité sur un score est une question de moyens et de temps davantage qu’un pari technologique.

D’ailleurs, Muse Spark l’avait déjà montré en avril : de bons résultats sur les benchmarks, sans pour autant dépasser OpenAI ou Anthropic. Le message implicite est clair. Fabriquer un très bon modèle, Meta y arrive. Convaincre développeurs et clients qu’il est en tête de l’industrie, c’est une autre affaire, et elle ne se règle pas au tableau de scores.

Car pendant que Meta vise GPT-5.5, OpenAI a déjà présenté GPT-5.6, son modèle le plus avancé, non encore ouvert au public en raison de contraintes réglementaires américaines. Courir après une cible qui a elle-même avancé, c’est le lot de qui rattrape : on égale la version d’hier.

Les agents, là où l’argent ne suffit plus

C’est sur le second front que tout se complique, et il est bien plus révélateur. Un agent IA planifie, appelle des outils, corrige ses erreurs et tient un objectif sur la durée, là où un modèle classique répond puis s’arrête. Cette fiabilité-là ne s’achète pas en empilant des cartes graphiques. Elle demande des méthodes, des garde-fous, une robustesse que même les meilleurs laboratoires peinent à garantir aujourd’hui.

L’organisation de Meta trahit à quel point l’entreprise y croyait. Plus tôt cette année, elle a licencié environ 8 000 personnes, soit 10 % de ses effectifs administratifs, et réaffecté 7 000 autres à des groupes IA, dont une équipe explicitement baptisée « Agent Transformation ». Le pari était limpide : remplacer une partie du travail humain par des agents. L’aveu de Zuckerberg revient à dire que ce remplacement s’avère plus difficile que prévu.

Le symptôme organisationnel est parlant. Meta a autorisé des ingénieurs à quitter l’équipe IA appliquée après les y avoir versés en masse, un revirement vécu par certains comme un « désengagement ». Andrew Bosworth, son directeur technique, avait décrit un moral parmi « les pires » de l’histoire de l’entreprise. Difficile de faire émerger des agents fiables dans ce climat-là.

Un bon score ne fait pas un bon agent

L’écart entre les deux annonces de Meta vaut avertissement. Un modèle qui brille sur un benchmark ne dit presque rien de sa tenue en agent autonome. Ce sont deux qualités distinctes : l’une se mesure en une passe, l’autre se juge sur des chaînes d’actions où la moindre erreur se propage.

Mieux vaut donc ne pas choisir un modèle sur ses seuls scores affichés quand l’usage visé est agentique. Ce qui compte alors : tient-il un objectif sur dix, vingt, cinquante étapes sans dérailler ? Reprend-il la main après un échec d’outil ? C’est là que se creusent aujourd’hui les écarts entre acteurs, pas dans la dernière décimale d’un classement.

Meta promet un tournant sous trois à six mois. Le calendrier mérite d’être pris pour ce qu’il est : l’échéance à laquelle on verra si des dizaines de milliards de dollars suffisent à transformer un excellent modèle en agent digne de confiance. Si même une entreprise dotée de tels moyens bute sur cette marche, elle nous renseigne sur la hauteur réelle de l’obstacle, pour tout le secteur.

Sources

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *