Les notes montent avec l’IA, le savoir non

Les notes montent avec l'IA, le savoir non

On a salué le chiffre comme une bonne nouvelle : depuis l’arrivée de ChatGPT, les notes grimpent à l’université. Treize points de pourcentage de A en plus, une moyenne générale qui monte de 0,12 point. La lecture spontanée est tentante : les étudiants, mieux outillés, apprendraient mieux et plus vite.

Sauf que les données racontent l’inverse. Ce ne sont pas les copies d’examen qui s’améliorent, ce sont les devoirs faits à la maison, hors de toute surveillance. La hausse ne mesure pas un cerveau qui progresse, mais une tâche qu’on délègue.

L’étude qui débranche l’optimisme

Le travail vient d’Igor Chirikov, qui a suivi huit semestres d’automne, de 2018 à 2025, sur 319 cours répartis dans 84 départements d’une grande université publique californienne. L’astuce méthodologique est élégante : il mesure l’exposition de chaque cours à l’IA d’après son mélange de devoirs tel qu’il existait à l’automne 2022, avant même que ChatGPT n’existe.

Autrement dit, on ne demande pas aux étudiants s’ils ont triché. On regarde simplement quels cours reposaient le plus sur des exercices de rédaction et de programmation, précisément là où l’IA excelle. Et c’est là, exactement là, que les notes explosent.

Le détail qui tranche : les A-moins et les B-plus se transforment en A pleins, pendant que le bas de la distribution ne bouge presque pas. La courbe ne se relève pas, elle se tasse vers le haut. Une promotion entière qui converge vers l’excellence en dit moins sur l’effort fourni que sur un plafond atteint artificiellement.

Le test qui sépare le travail de l’apprentissage

Chirikov pose la seule question qui compte : ces meilleures notes traduisent-elles un vrai gain de compétence, ou juste une machine qui fait le travail à la place ? Pour trancher, il regarde le poids des devoirs maison dans la note finale.

Le raisonnement est limpide. Si l’IA améliorait réellement l’apprentissage, la hausse devrait apparaître partout, que le cours s’appuie sur des devoirs libres ou sur des examens surveillés. Si au contraire l’IA ne fait que remplacer le travail de l’étudiant sur les exercices non supervisés, l’effet devrait se concentrer là où ces devoirs pèsent lourd.

Verdict : dans les cours où les devoirs comptent plus que la médiane, les A grimpent de 16 points supplémentaires par rapport à des cours équivalents mais moins dépendants des devoirs. Dans ces derniers, l’effet devient minuscule et statistiquement non significatif. Un résultat, écrit Chirikov, « difficile à concilier avec de réels gains d’apprentissage ».

Le clou : un test placebo sur les exposés oraux, exercice où l’IA aide peu. Là, les notes n’ont pas bougé d’un iota.

Une inflation des notes qui n’a rien d’ordinaire

On objectera que l’inflation des notes est un vieux serpent de mer. À Harvard, la part de A est passée de 24 % en 2005 à 60,2 % en 2025. Indulgence des correcteurs, concurrence entre établissements, politiques de notation : les explications ne manquaient pas.

Mais Chirikov souligne une différence de nature, pas de degré. Tous les moteurs précédents agissaient au moment de la correction, une fois la copie rendue. L’IA, elle, intervient en amont : elle change la façon dont le travail est produit, avant que l’enseignant n’y pose les yeux. Ce n’est plus une note trop généreuse sur un vrai travail, c’est une note juste sur un travail qui n’est plus tout à fait celui de l’étudiant.

La conséquence est froide. Si une note en rédaction ou en programmation reflète de plus en plus une production assistée plutôt qu’une compétence acquise, le diplôme perd sa valeur de signal. Employeurs et écoles doctorales sélectionnent alors sur un indicateur qui ment, et les mauvais paris se multiplient.

La boucle qui devrait vraiment inquiéter

L’étude pointe un effet plus pernicieux qu’une simple triche généralisée. Si l’IA absorbe pendant les études les tâches qui construisent justement les compétences, les diplômés finissent faibles là où la machine est forte. La dépendance se creuse au moment précis où l’on devrait apprendre à s’en passer.

Cette boucle alimente sa propre accélération : plus les humains délèguent les briques fondamentales, plus l’automatisation avance vite, plus l’écart de compétences se creuse sur le marché du travail. Le diplôme ne certifie plus une capacité, il certifie un accès à un outil que tout le monde possède déjà.

Même Sam Altman, patron d’OpenAI, l’a concédé dans un entretien récent : trois ans et demi après le lancement de ChatGPT, le système éducatif n’a quasiment pas réagi. Il s’attendait à une année de triche suivie d’une refonte de fond. Il constate surtout l’absence de tout changement systémique sérieux.

Repenser ce que l’école évalue

La tentation du retour au tout-examen surveillé est compréhensible, mais l’étude la juge insuffisante et difficile à généraliser. La piste plus sérieuse consiste à concevoir des exercices qui, soit verrouillent l’usage de l’IA, soit l’intègrent délibérément : documentation du processus de travail, échanges de suivi qui obligent l’étudiant à prouver qu’il comprend ce qu’il a rendu.

Pour quiconque recrute, forme ou encadre, l’enseignement est immédiat : cesser de lire une note comme une preuve de maîtrise, et reconstruire l’évaluation autour de ce qui ne se sous-traite pas. La capacité à expliquer, à défendre, à corriger une production assistée vaut désormais plus que la production elle-même. L’école qui l’aura compris la première gardera un diplôme qui veut encore dire quelque chose.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *