Être « dans les poids » d'une IA, un oubli impossible

Vous tapez votre nom dans un moteur de recherche par réflexe. Mais avez-vous déjà demandé à une IA si elle savait, sans aller chercher sur le web, qui vous êtes vraiment ? Un site répond désormais à cette question avec un chiffre. Et ce chiffre soulève un problème plus profond qu’il n’y paraît.

Un score de notoriété, façon jeu vidéo

Le site s’appelle In the Weights. Il a été conçu par Joey Flynn et Thomas Dimson, deux anciens d’OpenAI qui avaient rejoint l’entreprise via le rachat de leur studio de design Global Illumination. Le principe : interroger une dizaine de modèles (Grok, Gemini, plusieurs versions de GPT, Claude, Llama et quelques outsiders) avec une question du type « Qui est untel ? », regrouper les réponses similaires, puis attribuer un « strength score ».

Le résultat ressemble à un classement de jeu rétro, esthétique Nintendo comprise. Le score plafonne à 996, réservé à des noms comme Mozart, Shakespeare ou Taylor Swift. En haut du tableau au moment d’écrire ces lignes : l’acteur Macaulay Culkin et le ténor Luciano Pavarotti. Le commun des mortels, lui, oscille entre quelques dizaines et quelques centaines de points.

Dimson le reconnaît lui-même : la réception a été « folle », alors qu’il imaginait une simple curiosité. Le succès tient à une promesse à peine voilée : voir si l’on « vit pour toujours dans la superintelligence ».

Que veut dire « être dans les poids » ?

Pour comprendre, il faut ouvrir le capot. Un grand modèle de langage, c’est avant tout des milliards de valeurs numériques, les fameux « weights » (poids). Pendant l’entraînement, le modèle ajuste ces nombres pour encoder ce qu’il a vu passer. Apparaître « dans les poids », c’est donc que votre existence a été jugée assez fréquente, assez saillante dans le corpus, pour que le modèle vous restitue de mémoire, sans appeler la moindre recherche web.

L’analogie la plus juste n’est pas celle de la base de données, où chaque fiche est rangée à une adresse précise. C’est plutôt celle d’une mémoire humaine diffuse : un visage croisé mille fois est gravé, un inconnu aperçu une fois s’efface. Sauf que cette mémoire-là pèse des milliards de paramètres et qu’on ne peut pas lui demander de réviser ce qu’elle croit savoir.

D’où une logique contre-intuitive soulignée par les créateurs : plus le modèle est petit, plus il est dur d’y figurer. Apparaître dans le Llama de Meta, qui compte un milliard de paramètres, signifie que vous comptiez vraiment. La place est chère.

@tobi8ur sur X

Pourquoi on ne peut ni corriger ni effacer

Le tour amusant cache une réalité plus rugueuse. Une fois l’entraînement terminé, ce que le modèle « sait » de vous est figé dans ses poids. Vous ne pouvez pas envoyer un formulaire pour rectifier une erreur, ni demander la suppression d’une ligne comme on le ferait auprès d’un moteur de recherche.

Les créateurs pointent eux-mêmes les limites de l’exercice : les modèles peuvent halluciner des détails biographiques, une faute de frappe dans votre nom plombe le score, et les noms communs produisent des résultats médiocres parce qu’ils se confondent avec d’autres. Le site va jusqu’à signaler les hallucinations probables, comme un modèle qui transforme un nom propre bien réel en « forme ambiguë pouvant désigner plusieurs personnes ».

Le problème ? Ces approximations ne vivent pas dans un fichier qu’on édite. Elles sont diluées dans la masse statistique du modèle. Le droit à l’oubli, pensé pour des pages web indexées, n’a pas d’équivalent opérationnel à l’échelle d’un corpus d’entraînement. On peut filtrer une réponse en aval, pas réécrire ce qui a été appris.

Ce que ça change pour votre identité en ligne

La leçon dépasse le jeu de la vanité. À mesure que le trafic glisse des moteurs vers les assistants conversationnels, la question « que disent de moi les résultats de recherche ? » se double d’une autre : « que disent de moi les modèles, de mémoire ? ». Les deux ne se pilotent pas avec les mêmes leviers.

Trois constats utiles se dégagent :

ce qu’un modèle restitue sans outil reflète son corpus figé à une date, pas le web d’aujourd’hui : une information périmée peut survivre longtemps dans les poids ;
la confiance affichée par un modèle n’est pas une garantie de véracité : il peut énoncer une biographie fausse avec aplomb ;
comparer plusieurs modèles, comme le fait ce site, reste le moyen le plus simple de repérer les divergences et donc les zones d’invention.

Un critique du projet l’a résumé sèchement : cela revient « à demander à treize chatbots de vous parler de vous-même ». La pique est juste sur la méthode. Elle passe pourtant à côté de l’apport réel du projet : le site rend visible, et mesurable, un phénomène qui restait abstrait.

Dimson dit s’inspirer de la nouvelle de Terry Bisson They’re Made Out of Meat et s’amuse de l’idée que « tant de vies soient encodées dans une poignée de nombres à virgule flottante ». La formule fait sourire, mais elle décrit exactement le basculement en cours. Nos identités ne sont plus seulement indexées quelque part ; elles sont apprises, approximées, et désormais difficiles à reprendre en main. Reste une question que ce petit jeu pose sans la trancher : à mesure que ces modèles deviennent notre source par défaut, qui décidera de ce qu’ils ont le droit de retenir de nous ?

Sources

Global Illumination

Être « dans les poids » d’une IA, un oubli impossible

Un score de notoriété, façon jeu vidéo

Que veut dire « être dans les poids » ?

Pourquoi on ne peut ni corriger ni effacer

Ce que ça change pour votre identité en ligne

Sources

Un autre article ?

Amazon : témoigner sur l’IA peut-il coûter son poste ?

Deepfake : l’UE ne sait plus le définir, le retail s’engouffre

Chatbots « amis » : Signal pointe le mauvais danger

Laisser un commentaire Annuler la réponse