Détecter l’IA : la technique sait, l’économie refuse

Détecter l'IA : la technique sait, l'économie refuse

Trois ans après ChatGPT, on ne sait toujours pas dire avec certitude si un texte sort d’un cerveau ou d’un modèle. Le réflexe est d’y voir une limite technique. C’est l’inverse : la technique, elle, sait déjà faire. Ce qui manque, c’est la volonté de s’en servir.

La distinction n’est pas un détail. Elle change tout ce qu’on peut attendre des prochaines années.

Ce que la technique promet, ce que le marché refuse

Mettez les deux faces côte à côte. D’un côté, la prouesse : en août 2024, le Wall Street Journal révélait qu’OpenAI disposait depuis environ un an d’un système de marquage invisible de ses textes, capable, selon des documents internes, de reconnaître une sortie de ses modèles avec un taux de réussite de 99,9 %. Le principe est élégant : infléchir très légèrement la façon dont le modèle compose ses phrases pour y glisser un motif imperceptible à la lecture, mais lisible par un algorithme.

De l’autre côté, la décision : l’outil n’a jamais été déployé. Pas faute de marcher. Faute d’intérêt à le faire.

Tout l’écart entre les deux tient dans une phrase du Wall Street Journal : les équipes d’OpenAI étaient « tiraillées entre l’engagement pris en faveur de la transparence et le désir d’attirer et de retenir les utilisateurs ». La transparence est un principe. La rétention, un chiffre d’affaires. Quand un principe affronte un revenu, on connaît l’issue par défaut.

La traçabilité, un coût que personne ne veut payer

Les données internes citées par le quotidien américain rendent l’arbitrage limpide. Une étude menée auprès des utilisateurs en 2023 montrait que plus de 30 % d’entre eux se déclaraient prêts à réduire leur usage de ChatGPT si un tel marquage existait, et 69 % redoutaient qu’il débouche sur de fausses accusations de triche. Rendre un texte traçable, c’est donc, pour l’éditeur, fragiliser sa propre base d’usagers et inviter le contournement.

Posez la question à l’envers : qui gagnerait à ce que les sorties d’un modèle soient signées ? L’enseignant, l’éditeur, le recruteur, le lecteur. Jamais le fournisseur du modèle, dont la valeur tient précisément à ce que sa production passe pour humaine. Le marquage est un service rendu à des tiers, financé par celui qui n’en retire que des inconvénients. Aucun marché ne tient sur cette équation.

L’histoire le confirme. Dès janvier 2023, OpenAI avait lancé un détecteur gratuit, l’AI Text Classifier, qui notait la probabilité qu’un texte soit synthétique. Entraîné surtout sur de l’anglais, inopérant sous mille caractères, il identifiait correctement 26 % des textes générés par IA tout en classant à tort 9 % de textes humains comme suspects, de l’aveu même de l’entreprise. Débranché six mois plus tard. La leçon retenue ne fut pas « améliorons-le », mais « passons à autre chose ».

Pourquoi l’image avance quand le texte stagne

Le contraste avec l’image éclaire le mécanisme. En mai dernier, OpenAI a mis en ligne un outil capable de reconnaître les visuels créés avec ChatGPT, en croisant les métadonnées C2PA et le filigrane invisible SynthID développé par Google DeepMind. Côté image, la traçabilité avance ; côté texte, elle s’enlise.

La différence n’est pas de difficulté. Elle est d’enjeu. Sur l’image, la pression réglementaire et industrielle pousse à signer les contenus, sous le poids des deepfakes et des litiges sur les droits. Sur le texte, l’usage massif en milieu éducatif et professionnel est devenu un argument commercial : un texte qu’on peut faire passer pour le sien se vend mieux qu’un texte estampillé « écrit par une machine ». Là où l’incitation existe, la technique se déploie. Là où elle manque, la même technique dort dans un tiroir.

Produire ou évaluer du texte, sans pouvoir le détecter

Le constat se traduit en consignes simples. Cessez d’attendre le détecteur miracle : son absence n’est pas un retard, c’est un équilibre stable que rien, dans le marché actuel, ne vient bousculer. Les outils tiers qui prétendent trancher restent calés sur les mêmes faux positifs qui ont coulé l’AI Text Classifier, avec un risque réel d’accuser à tort un auteur humain.

La conséquence est lourde quand certaines études, sans doute alarmistes, estiment que plus de la moitié des contenus publiés sur le web seraient déjà synthétiques. Si l’on ne peut pas détecter, il faut déplacer la confiance ailleurs : vers la traçabilité à la source plutôt que la détection à l’arrivée, vers la réputation de l’auteur, la vérification des faits, la chaîne de provenance d’un document. Le marquage volontaire ayant échoué, c’est l’identité de l’émetteur, et non la signature du texte, qui devient l’actif à protéger.

Le seul levier qui reste : la contrainte

Si l’inaction est un calcul rationnel, alors aucun progrès spontané n’est à espérer. Un acteur ne tracera ses sorties que si tous y sont contraints en même temps, faute de quoi le premier à jouer le jeu perd ses utilisateurs au profit des autres. Google DeepMind a beau avoir déployé son propre filigrane de texte, SynthID, dans Gemini et en avoir publié le code en open source, un marqueur isolé ne règle rien tant que le premier éditeur de l’usage s’en abstient. C’est exactement le type de blocage qu’une norme est faite pour lever.

L’AI Act européen, avec ses obligations de marquage des contenus générés, est le premier dispositif à transformer une bonne intention invendable en règle opposable à tous. La question n’est plus de savoir si la détection est possible : elle l’est. Elle est de savoir si le droit saura imposer ce que le marché, laissé à lui-même, a déjà choisi de ne jamais faire.

Sources

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *