2 dollars l'heure pour entraîner son remplaçant 2 dollars l'heure pour entraîner son remplaçant

2 dollars l’heure pour entraîner son remplaçant

En Inde, des milliers de personnes filment leurs gestes du quotidien pour 2 dollars l’heure. Elles fabriquent la donnée qui entraîne les robots censés les remplacer.

Une caméra sanglée sur le front, une mère de famille de Chennai filme ses mains qui découpent une mangue. Le geste est anodin. Ce qu’il produit ne l’est pas.

Pour un peu plus de 2 dollars l’heure, Nagireddy Sriramyachandra alimente des modèles d’IA qui apprennent à bouger comme des humains dans le monde réel. Son travail, parfaitement invisible, vaut de l’or pour des multinationales qui figurent au classement Fortune 500. Le débat habituel oppose l’IA aux emplois qu’elle détruit. Le vrai sujet est ailleurs : qui empoche la valeur de ce travail que personne ne nomme ?

L’angle mort de la donnée incarnée

Les chatbots et les générateurs d’images se nourrissent de texte et de pixels déjà numérisés, disponibles en quantité quasi infinie sur le web. Pour un robot qui doit plier du linge ou préparer un café, c’est une autre histoire. Il lui faut de la donnée « égocentrique » (des vidéos filmées à la première personne, du point de vue de celui qui agit) que personne n’a jamais collectée à grande échelle.

Cette matière première n’existe pas spontanément. Il faut la fabriquer, geste par geste, dans des cuisines et des ateliers. C’est précisément là que des milliers de travailleurs indiens entrent en scène, équipés de caméras GoPro, de lunettes connectées et de capteurs de mouvement. L’Inde s’est positionnée comme l’intermédiaire mondial de la création, du traitement et de l’annotation de la donnée d’IA.

Un détail technique en dit long sur le rapport de force. Quand l’application détecte mal le mouvement, elle hurle « hands not detected » (mains non détectées). Ce n’est pas l’humain qui pilote la machine. C’est la machine qui cadence l’humain.

Une chaîne d’extraction soigneusement anonyme

Suivez le trajet de l’une de ces vidéos de découpe de mangue. Elle part d’une cuisine de Chennai, transite par une société de données qui dispose de bureaux en Inde et aux États-Unis, s’appuie sur une plateforme d’apprentissage automatique opérée par un géant du cloud, puis nourrit le modèle d’un client multinational. À chaque maillon, la valeur se concentre un peu plus. Tout en haut de la chaîne, on parle en milliards de dollars de marché. Tout en bas, on parle en roupies de l’heure.

« Qui d’autre vous donnera 250 roupies de l’heure juste pour faire le ménage ? » lance la travailleuse. La question est sincère, et c’est ce qui la rend troublante. Pour elle, l’offre est rationnelle : un revenu d’appoint pour un geste qu’elle accomplissait de toute façon. Le problème n’est pas son choix individuel. Le problème, c’est l’asymétrie d’une équation où le geste vaut 2 dollars à la source et alimente des actifs valorisés à l’autre bout du monde.

C’est le propre du travail de la donnée : il disparaît dans le produit fini. Personne, en regardant un robot ménager fonctionner, ne verra la femme qui lui a appris à tenir un couteau.

Ce que ça change pour qui orchestre l’IA

Pour un praticien qui assemble des systèmes d’IA au quotidien, cette histoire n’est pas un fait divers social lointain. Elle révèle une dépendance qu’on a tendance à oublier dès qu’on raisonne en API et en poids de modèle.

  • La donnée incarnée est le vrai goulet d’étranglement de la robotique. Tant qu’il faudra filmer des humains réels pour apprendre aux machines des gestes simples, la promesse du robot polyvalent restera tributaire d’une logistique humaine massive, lente et coûteuse à organiser.
  • Le coût affiché d’un modèle masque un coût caché. Quand un fournisseur annonce un robot capable de cuisiner, il vend l’aboutissement d’une chaîne d’annotation dont le prix social n’apparaît nulle part dans la fiche technique.
  • La traçabilité de la donnée devient un enjeu de gouvernance. D’où vient le jeu d’entraînement ? Dans quelles conditions a-t-il été produit ? Ces questions, longtemps réservées au texte et aux images, vont rattraper la robotique.

Tous les acteurs ne misent pas sur cette collecte manuelle de masse : NVIDIA, lui, parie sur la simulation, en générant des centaines de milliers de trajectoires synthétiques à partir d’une poignée de démonstrations humaines pour entraîner GR00T, son modèle de fondation pour robots humanoïdes. Mais l’humain reste, là encore, au point de départ de la chaîne.

Une experte du travail numérique, citée dans la presse, anticipe que ces services de collecte de données vont se multiplier. Autrement dit, ce modèle n’est pas une parenthèse. C’est une infrastructure en train de s’installer.

Une fenêtre qui se referme

Le patron de la société de données le formule sans détour : « Certains métiers sont censés être pris en charge, pour que les humains aillent faire de meilleures choses. » La phrase a quelque chose de glaçant quand elle est adressée à celles et ceux qui entraînent, de leurs propres mains, le système qui prendra leur place.

En Inde, ce travail crée de l’emploi « pour l’instant ». L’expression mérite qu’on s’y arrête. Elle décrit une fenêtre transitoire : une population fournit la donnée nécessaire à sa propre automatisation, et cette fenêtre se refermera mécaniquement le jour où les modèles seront assez bons. La banque d’affaires Morgan Stanley évoque plus d’un milliard de robots humanoïdes en service d’ici 2050, principalement pour des usages industriels et commerciaux. À cette échelle, le besoin en travailleurs-annotateurs n’est pas appelé à durer.

Reste une asymétrie qu’aucune prouesse technique ne résoudra toute seule : celle qui sépare la main qui produit la donnée du capital qui la transforme en machine. Tant qu’on regardera la robotique comme un pur problème d’ingénierie, on continuera de ne pas voir ces femmes et ces hommes. La vraie question n’est peut-être pas de savoir si les robots sauront un jour découper une mangue. C’est de décider qui, dans cette chaîne, mérite d’en récolter le fruit.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *