Quand l’auditeur hallucine : KPMG retire son rapport IA

Quand l'auditeur hallucine : KPMG retire son rapport IA

Un cabinet d’audit qui retire son propre rapport pour cause d’erreurs : la scène a quelque chose d’ironique. Surtout quand le rapport vantait l’excellence à l’ère de l’IA agentique, et qu’il a fini par être rattrapé par les hallucinations de cette même IA.

Le récit dominant tient en une ligne : « l’IA invente des faits, donc l’IA n’est pas fiable ». C’est commode, mais c’est passer à côté de l’essentiel. Le vrai sujet n’est pas la machine. C’est ce qui n’a pas eu lieu autour d’elle.

Ce qui s’est réellement passé

KPMG a retiré de ses sites un rapport intitulé « Redefining excellence in the age of agentic AI », publié en octobre 2025. Le motif : plusieurs organisations citées ont fait savoir que les affirmations sur leur usage de l’IA étaient fausses ou trompeuses.

Parmi elles, des noms qui ne sont pas anodins : la banque UBS, le service de santé britannique (NHS), les chemins de fer fédéraux suisses et Transport for London. Quatre institutions, quatre démentis. Le groupe de recherche GPTZero, spécialiste de la détection de texte généré, a identifié une série d’inexactitudes qu’il attribue à des hallucinations d’IA.

Autrement dit : un cabinet d’audit a vraisemblablement utilisé l’IA pour écrire un rapport sur l’IA, sans vérifier ce qu’elle affirmait. Un porte-parole a confirmé le retrait du document, le temps d’une enquête interne.

Le problème n’est pas l’outil, c’est la chaîne cassée

Une hallucination, c’est le comportement attendu d’un modèle de langage : il produit la suite de mots la plus plausible, pas la plus vraie. Lui reprocher d’halluciner revient à reprocher à une calculatrice de ne pas faire le café. Ce n’est pas un bug, c’est sa nature statistique.

Le scandale n’est donc pas que l’IA ait inventé des chiffres. Le scandale, c’est qu’aucun humain n’ait relu avant publication. Dans un métier où la signature d’un cabinet vaut caution, le document est parti sans que personne ne remonte à la source pour confirmer une seule des affirmations sur ses propres clients.

Le porte-parole l’a d’ailleurs dit lui-même : la maison attend de ses équipes une « supervision humaine pour valider le contenu et vérifier des sources indépendantes ». La règle existait. Elle n’a pas été appliquée.

Quand la source fait foi, la vérification n’est pas optionnelle

Il existe des métiers où l’affirmation non sourcée n’a aucune valeur : audit, droit, médecine, journalisme, recherche. Dans ces univers, ce qui compte n’est pas ce qu’on affirme, mais ce sur quoi l’affirmation repose. La traçabilité est le produit.

C’est précisément là que l’IA générative crée un piège. Elle produit un texte d’une fluidité irréprochable, avec le ton et la mise en forme d’un livrable expert. La forme inspire confiance ; le fond n’est pas vérifié. Plus le rendu est crédible, moins on a le réflexe de contrôler.

Et ce cas n’est pas isolé. Le mois précédent, un autre grand cabinet avait retiré un rapport sur les programmes de fidélité, qui contenait des notes de bas de page apparemment fabriquées. Deux signaux rapprochés, même cause profonde : la vérification reportée à plus tard, c’est-à-dire jamais.

Ce que ça change pour qui orchestre l’IA

Pour quiconque intègre ces outils dans un flux de production, la leçon est opérationnelle, pas philosophique. L’IA accélère la rédaction ; elle n’externalise pas la responsabilité. Quelques principes simples à graver dans le processus :

  • Toute affirmation factuelle générée par un modèle est une hypothèse, pas un fait, tant qu’une source primaire ne l’a pas confirmée.
  • Plus le livrable engage une signature ou une caution, plus le point de contrôle humain doit être explicite et tracé, pas implicite.
  • La vérification se concentre là où ça fait mal : chiffres, citations, noms propres, références. C’est exactement ce qu’un modèle invente le plus volontiers.
  • Faire relire le texte par un second modèle ne remplace pas la vérification : deux IA peuvent halluciner de concert avec le même aplomb.

Le gain de productivité est réel. Mais il se mesure après le contrôle, pas avant. Un rapport publié puis retiré coûte infiniment plus cher qu’un rapport relu une journée de plus.

Une crise de confiance, ou une discipline à réinventer ?

On voudra lire cet épisode comme une énième preuve que l’IA n’est pas mûre. Ce serait confortable, et faux. L’outil fonctionne exactement comme prévu. Ce qui a failli, c’est la méthode : la conviction qu’un texte bien tourné pouvait dispenser de remonter aux faits.

La vraie mutation n’est pas technologique, elle est culturelle. Tant qu’on traitera la sortie d’un modèle comme un livrable et non comme un brouillon à vérifier, ces retraits se multiplieront, dans l’audit comme ailleurs.

La question n’est donc pas de savoir si l’IA va halluciner : elle le fera, par construction. Elle est de savoir qui, dans la chaîne, accepte encore de mettre son nom sur ce qu’il n’a pas vérifié.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *