
Une autrice demande à un chatbot la fin d’une série policière. La machine répond, avec aplomb. Elle se trompe. Pourquoi un modèle qui a « lu » des centaines de critiques sur ce programme peut-il ignorer son dénouement ? La réponse en dit plus long sur l’IA que sur l’erreur elle-même.
La scène : un chatbot, une romancière, une mauvaise réponse
Interrogée lors d’un festival littéraire à Porto, Margaret Atwood, romancière canadienne connue pour The Handmaid’s Tale, raconte avoir essayé une fois un assistant IA, Claude d’Anthropic. Elle cherchait des informations sur Father Brown, une série policière britannique. Le résultat l’a déçue.
Sa formule est nette : « Claude m’a donné la mauvaise réponse, ou il a menti. Bien sûr, il ne savait pas qu’il mentait, parce que ce n’est pas un être humain : c’est un modèle de langage. » Et elle ajoute la clé de l’affaire : le système « avait parcouru et échantillonné de nombreuses critiques télévisées, mais elles ne révèlent jamais la fin », donc il a été « induit en erreur par ce qu’il avait lu ».
Le piège n’est pas où on l’attend.
Pourquoi le modèle ne pouvait pas savoir
On parle souvent d’« hallucination » pour décrire une IA qui invente. Le terme désigne une réponse fabriquée à la génération, quand le modèle comble un vide par du plausible. Ici, le mécanisme est différent, et plus instructif.
Un modèle de langage (LLM, pour large language model) ne « connaît » rien au sens humain. Il prédit la suite la plus probable d’un texte à partir de ce qu’il a vu pendant son entraînement. Sa carte du monde, c’est la masse de textes qu’il a ingérés. Si une information n’y figure pas, elle n’existe pas pour lui.
Or les critiques de séries en ligne obéissent toutes à une règle tacite : on ne divulgâche pas la fin. Le dénouement de Father Brown est donc soigneusement absent des textes que le modèle a échantillonnés. Le résultat ? L’IA n’a pas inventé une fin par caprice : elle a reproduit fidèlement un corpus qui, collectivement, garde le secret. Elle a hérité d’un angle mort que ses sources avaient elles-mêmes organisé.
L’analogie de la bibliothèque amputée
Imaginez un lecteur enfermé dans une immense bibliothèque consacrée à une série, avec un seul interdit : aucune des critiques ne mentionne le dénouement. Vous pouvez le laisser lire des années. Posez-lui la question de la fin, et il ne pourra que deviner à partir d’indices indirects : ton des résumés, allusions, comparaisons. Il répondra avec assurance, parce que c’est tout ce qu’il sait faire. Et il aura tort.
Le modèle est ce lecteur. Le défaut n’est pas dans sa tête, il est dans les rayonnages. C’est ce que résume la vieille maxime de l’informatique qu’Atwood reprend mot pour mot, « garbage in, garbage out » : des données médiocres ou trouées en entrée donnent des sorties médiocres ou trouées. Le verdict d’une IA ne vaut jamais mieux que la matière qu’on lui a donnée à digérer.
Le problème se joue à l’entrée, pas à la sortie
Cette nuance déplace tout le débat sur la fiabilité. Beaucoup d’efforts visent la génération : garde-fous, vérificateurs, citations forcées, ré-écriture des réponses douteuses. Utile, mais incomplet. Si la donnée d’origine est lacunaire, biaisée ou périmée, aucun filtrage en aval ne recréera ce qui n’a jamais été appris.
Le cas est presque comique, parce qu’il porte sur la fin d’un feuilleton. Transposez-le à un dossier médical, à une jurisprudence récente, à une procédure interne jamais publiée sur le web : le même trou produit la même fausse certitude, avec des enjeux autrement sérieux. Une IA branchée sur des informations « récupérées, publiées précédemment et potentiellement obsolètes » répétera les silences et les retards de ses sources.
D’où l’essor des approches qui consistent à nourrir le modèle, au moment de la question, avec des documents à jour et vérifiés plutôt qu’à se fier à sa seule mémoire d’entraînement (le RAG, retrieval-augmented generation). C’est déjà le réflexe des assistants grand public qui interrogent le web en direct : ChatGPT lance une recherche quand la question l’exige, et Gemini ancre ses réponses dans Google Search pour dépasser sa date de coupure. La logique est exactement celle d’Atwood : si la qualité se joue à l’entrée, c’est l’entrée qu’il faut soigner.
S’appuyer sur l’IA sans confondre aplomb et savoir
La romancière n’est pas tendre avec ceux qui cherchent « la solution facile ». Sa conclusion, elle, est de bon sens technique : « Même les personnes qui l’utilisent pour des raisons professionnelles doivent vérifier, car elle fait des erreurs. »
Concrètement, cela invite à quelques réflexes. Vérifier une réponse non pas parce que le modèle « ment », mais parce qu’il ne peut pas connaître ce que ses données ne contiennent pas. Se méfier d’autant plus que le sujet est récent, confidentiel ou volontairement tu en ligne. Et privilégier, pour les usages sérieux, les dispositifs qui ancrent la réponse dans une source identifiable plutôt que dans une moyenne statistique de tout le web.
Le talent d’un modèle de langage n’efface pas cette dépendance première à ses données. La prochaine fois qu’une IA vous répond du tac au tac, demandez-vous d’abord si la réponse existait quelque part dans ce qu’elle a pu lire. Si rien ne le garantit, sa belle assurance ne pèse rien.
