Quand l'IA programme un robot 20 fois plus vite que nous

Qu’est-ce qui sépare encore un modèle de langage du monde réel, celui des moteurs, des capteurs et des pattes qui se posent au sol ? Une chose, surtout : le code. Et c’est précisément ce mur que vient de franchir une expérience d’Anthropic baptisée Projet Fetch.

Dans cette deuxième phase, dévoilée par la Frontier Red Team d’Anthropic, l’objectif était de mesurer la capacité de Claude à programmer un robochien, un robot quadrupède. Le résultat est saisissant : laissé à lui-même, Opus 4.7 s’est révélé environ 20 fois plus rapide que la meilleure équipe humaine de l’an dernier, pourtant épaulée par la génération précédente, Opus 4.1.

De quoi parle-t-on, concrètement ?

Un robot quadrupède ne marche pas tout seul. Pour qu’il avance, se redresse ou contourne un obstacle, il faut traduire une intention (« avance », « tourne ») en instructions précises envoyées à chaque moteur, des dizaines de fois par seconde. C’est ce qu’on appelle le code de contrôle.

Historiquement, écrire ce code est un travail d’ingénierie pointu : on tâtonne, on règle, on observe le robot trébucher, on corrige. Beaucoup d’essais, beaucoup d’erreurs. C’est ce cycle laborieux que l’expérience a placé entre les mains du modèle.

Le mécanisme, étape par étape

Dans le protocole, Claude n’actionne pas directement le robot. Il fait ce qu’un développeur humain ferait : il écrit le programme qui, lui, pilote la machine. Puis il observe ce qui se passe, repère ce qui cloche et réécrit son code en conséquence. La boucle classique de la programmation, donc, mais déroulée par le modèle.

L’image qui éclaire le mieux la chose ? Pensez à un entraîneur qui ne court pas lui-même, mais qui rédige le plan d’entraînement, regarde l’athlète l’exécuter, puis ajuste. Sauf qu’ici l’entraîneur rédige, teste et corrige son plan à une cadence qu’aucune équipe humaine ne peut soutenir.

@AnthropicAI sur X

C’est là que se loge le chiffre de 20. Il ne dit pas que le modèle est « plus intelligent » dans l’absolu. Il dit qu’il boucle ce cycle écrire-tester-corriger à une vitesse qui change la nature même de la tâche.

Pourquoi ce facteur 20 compte vraiment

Le plus frappant se niche ailleurs que dans l’écart avec l’humain : il tient à la distance entre deux générations de modèles. La référence humaine de l’expérience était déjà assistée par Opus 4.1. Le point de comparaison n’était donc pas un ingénieur seul, mais un ingénieur outillé par une IA récente. Et c’est cette équipe augmentée qu’Opus 4.7 distance d’un facteur 20.

Cela raconte deux choses. D’abord, la marche entre deux versions d’un même modèle n’est pas linéaire sur ce type de tâche : elle se compte en multiples, pas en pourcentages. Ensuite, le terrain de jeu se déplace. On ne mesure plus seulement la capacité d’un modèle à écrire du texte ou à résoudre un problème abstrait, mais à produire du code qui agit sur la matière.

Du code qui parle au monde physique

C’est le vrai signal de l’expérience, au-delà de l’image amusante d’un robot à quatre pattes. Jusqu’ici, le code généré par les modèles restait largement confiné au logiciel : des applications, des scripts, des pages web. Le Projet Fetch montre une IA qui écrit le code de contrôle d’un objet qui se déplace dans une pièce.

L’approche tranche d’ailleurs avec celle de Google DeepMind, dont les modèles Gemini Robotics traduisent eux-mêmes la perception en commandes motrices : là où Gemini pilote directement le robot, Claude écrit le programme qui le pilote.

@AnthropicAI sur X

La frontière entre « générer du texte » et « agir sur le monde » n’est plus une falaise, c’est une marche. Le langage naturel d’un côté, des moteurs qui tournent de l’autre, et au milieu un modèle qui rédige le pont entre les deux.

Ce qu’il faut garder en tête avant de s’emballer

Quelques réserves de méthode s’imposent, et elles n’enlèvent rien à l’intérêt du résultat. Il s’agit d’une expérience interne menée par l’équipe d’Anthropic, sur une tâche cadrée : la vitesse mesurée porte sur la programmation du robot, pas sur une autonomie générale du système dans des conditions imprévues.

Un robot qui apprend à marcher dans un cadre maîtrisé reste loin d’une machine fiable dans le chaos du réel, où les surfaces glissent et les obstacles surgissent. Le « 20 fois plus vite » dit la productivité du cycle de développement, pas la robustesse du robot une fois lâché dehors.

Reste l’essentiel pour qui orchestre l’IA au quotidien : la boucle écrire-tester-corriger, longtemps considérée comme le cœur irréductible du métier d’ingénieur, devient un terrain où le modèle prend une avance qui se compte en ordres de grandeur. Le code n’est plus seulement ce qu’on demande à l’IA de produire. Il devient ce par quoi elle commence à toucher le monde physique.

Quand l’IA programme un robot 20 fois plus vite que nous

De quoi parle-t-on, concrètement ?

Le mécanisme, étape par étape

Pourquoi ce facteur 20 compte vraiment

Du code qui parle au monde physique

Ce qu’il faut garder en tête avant de s’emballer

Sources

Un autre article ?

Des chèvres dans Age of Empires piègent la recherche IA

173 scientifiques, 750 tâches : le test IA d’OpenAI

GLM-5.2 : à un point d’Opus 4.8, et ouvert

Laisser un commentaire Annuler la réponse