
L’histoire a tout du scandale moral classique. Cinquante étudiants de Brown University, l’une des huit universités de l’Ivy League, auraient triché à un examen d’économie en soufflant les questions à ChatGPT. Le professeur dénonce, l’institution traîne des pieds, le diplôme vacille. Voilà le récit qui circule.
Sauf que ce cadrage se trompe de cible. Que cinquante personnes aient triché compte moins que la facilité, la rentabilité et l’invisibilité de la manœuvre. L’affaire ECON 1170 ne met pas à nu la malhonnêteté d’une promotion, mais l’obsolescence d’un format d’évaluation qui demande encore à des humains de faire, sous pression, exactement ce qu’un assistant conversationnel produit en quelques secondes.
Au-delà du record de fraude
Les faits, d’abord. Roberto Serrano, titulaire de la chaire Harrison S. Kravis à Brown, affirme détenir des preuves concluantes qu’au moins cinquante étudiants du cours ECON 1170 ont fraudé à l’examen de mi-session. La méthode de détection est limpide : certaines copies contenaient des passages inhabituels, coïncidant avec les réponses obtenues en soumettant les mêmes questions à ChatGPT. L’information a été relayée par la presse fin juin 2026.
Serrano parle du plus vaste cas de fraude connu dans l’Ivy League, Harvard, Yale et Princeton compris. Le chiffre marque, le prestige des établissements amplifie l’écho. Mais réduire l’affaire à un record de tricheurs, c’est s’arrêter au symptôme. La question dérangeante est ailleurs : pourquoi un examen restait-il faisable, en 2026, par simple copier-coller dans une fenêtre de conversation ?
L’examen testait une compétence que l’IA a absorbée
Un examen écrit d’économie sur des questions fermées évalue une chose précise : la capacité à restituer un raisonnement type, structuré, à partir d’un énoncé. Or c’est très exactement la tâche sur laquelle les grands modèles de langage excellent. Reformuler un problème, dérouler une démonstration attendue, produire une réponse propre et plausible : l’outil ne contourne pas l’épreuve, il la résout dans les termes mêmes où elle est posée.
D’où le malaise. Quand l’IA réussit l’examen mieux et plus vite que l’étudiant moyen, ce n’est plus l’étudiant qu’on prend en défaut, c’est l’instrument de mesure. La copie devient un test de discipline (ne pas ouvrir l’onglet) bien plus que de compréhension. Et un test de discipline ne mesure pas une compétence : il mesure une obéissance.
La réponse de Brown le confirme à son insu. L’examen de mi-session n’a pas été annulé. En revanche, l’examen final, qui compte pour la moitié de la note, se tiendra désormais en présentiel. Traduction concrète : pour préserver la valeur de l’épreuve, il a fallu reconstruire un sas physique sans écran. On ne corrige pas le contenu de l’évaluation, on en verrouille l’accès. Aveu, plus que solution.
Pourquoi l’institution a-t-elle tardé ?
L’autre fil de l’affaire, c’est la lenteur de Brown. Selon Serrano, les responsables de l’établissement, président et doyen compris, auraient d’abord opposé un silence ; le doyen ne se serait exprimé qu’une fois le dossier porté devant le comité du code académique. On peut y lire de la frilosité réputationnelle, et elle est réelle.
Mais ce silence raconte aussi un piège bien plus large. Reconnaître publiquement cinquante fraudes, c’est admettre que le dispositif d’évaluation a été pris en défaut à grande échelle. Aucune institution ne sanctionne volontiers cinquante de ses propres étudiants d’un coup, parce que le geste pointe en retour vers l’établissement : si la moitié d’un amphi a pu tricher sans se faire repérer en temps réel, qui a laissé le format intact ? Le silence n’est pas seulement de la prudence. C’est le réflexe d’un système qui préfère ne pas regarder ce que l’épisode dit de lui.
Recrutement, certifications : le même angle mort
Le cas Brown dépasse de loin l’amphithéâtre. Toute organisation qui mesure une compétence par une production écrite individuelle, sans contrôle d’environnement, vit le même angle mort : entretiens techniques à distance, tests de recrutement, certifications, devoirs à la maison. Partout où la tâche évaluée recoupe ce que fait bien un modèle de langage, le résultat ne dit plus grand-chose de la personne.
Deux directions se dessinent, et aucune n’est confortable. Soit on referme l’environnement, présentiel, surveillance, déconnexion : c’est la voie choisie par Brown, simple à mettre en œuvre, mais qui fige l’évaluation dans un monde où l’IA n’existerait pas. Soit on change ce qu’on mesure : non plus la production d’une réponse, mais la capacité à piloter, critiquer et corriger celle d’un modèle. Demander à un étudiant de soumettre un raisonnement à ChatGPT, puis d’en débusquer les erreurs et d’en assumer les choix, teste une compétence que l’outil, lui, ne possède pas.
Les cinquante étudiants de Brown seront sanctionnés, et c’est cohérent : la règle existait, ils l’ont enfreinte. Mais s’arrêter à leur faute reviendrait à blâmer le thermomètre qui annonce la fièvre. L’épreuve qu’ils ont contournée mesurait une chose que la machine fait mieux qu’eux. La décision qui compte n’appartient pas au comité de discipline : elle revient à tous ceux qui continuent d’évaluer des humains sur le terrain où l’IA vient de les dépasser.
