Même Grok penche à gauche : le biais est dans les données

Même Grok penche à gauche : le biais est dans les données

Quatre-vingts pour cent. C’est la part des réponses de GPT-5.5 qui, dans une enquête du Washington Post, ne contenaient que des arguments orientés à gauche. Une seule fois sur l’ensemble du test, le modèle d’OpenAI a défendu une position exclusivement à droite. Le chiffre est spectaculaire. Reste à savoir ce qu’il dit une fois replacé à côté des cinq autres modèles passés au même crible.

80 %, et le reste du classement

Le Washington Post a soumis les mêmes questions politiques à six grands modèles, puis trié chaque réponse en « gauche », « droite » ou « les deux camps ». GPT-5.5 arrive en tête du penchant à gauche avec ses 80 %. Juste derrière, le V4 Pro de DeepSeek affiche 70 % de réponses exclusivement orientées à gauche. Les deux modèles plaidaient par exemple contre la peine de mort, alors qu’une majorité d’Américains y reste favorable depuis des décennies selon Gallup.

Plus loin dans le classement, Claude Opus 4.8 d’Anthropic donne une réponse exclusivement à gauche dans 43 % des cas et présente les deux camps dans les 57 % restants. La dispersion entre modèles est réelle. Mais la direction, elle, ne varie pas : tous penchent du même côté, à des degrés divers.

Que vaut ce 80 % ? Pris seul, il mesure l’intensité du penchant d’un modèle. Mis en série avec les autres, il dit autre chose : un alignement de fond, partagé, qui ne dépend ni de l’éditeur ni de son discours commercial.

Pourquoi Grok contredit son propre positionnement

Le cas le plus parlant n’est pas le plus extrême, c’est le plus inattendu. Grok 4.3 de xAI est vendu par Elon Musk comme une IA « en quête de vérité » et anti-« woke ». Dans le test, il produit bien davantage de réponses orientées à droite que n’importe quel autre modèle. Et pourtant, il répond plus souvent de façon exclusivement à gauche.

Le détail compte. Un modèle conçu et commercialisé pour pencher à droite penche quand même à gauche. L’explication avancée est simple : Grok a été entraîné sur les mêmes données que ses concurrents, voire sur leurs propres sorties. Le marketing positionne le produit ; le corpus, lui, décide du résultat.

Gab, plateforme classée à droite, propose de son côté un modèle baptisé Arya, présenté comme « bâti sur des valeurs chrétiennes et des principes conservateurs ». Dans la même enquête, Arya a répondu par un argument de gauche douze fois plus souvent que par un argument de droite. Douze fois. Le slogan promettait un alignement, les chiffres en livrent l’inverse.

Peut-on débiaiser une moyenne du web ?

C’est là que les chiffres cessent d’être une curiosité pour devenir un enseignement technique. Un grand modèle de langage apprend les régularités statistiques d’un immense corpus de textes : pages web, forums, articles, livres numérisés. Ce corpus n’est pas neutre, il porte la distribution des opinions qui s’expriment en ligne. Le modèle en restitue la moyenne pondérée.

D’où le cœur de ces mesures : le penchant politique observé n’est pas une ligne éditoriale qu’un éditeur aurait choisie et qu’un concurrent pourrait corriger par décret. C’est une propriété du matériau d’entraînement. On le voit précisément parce que Grok et Arya échouent : deux acteurs ont explicitement voulu produire un modèle orienté à droite, et la pesanteur du corpus a repris le dessus.

Cet ancrage dans les données change tout au moment de déployer un modèle. Le prompt système (les instructions cachées qui cadrent le comportement de l’IA), le fine-tuning léger (un réentraînement partiel) ou la simple consigne « sois neutre » agissent en façade ; ils ne réécrivent pas la distribution apprise sur des milliards de tokens, ces fragments de texte que le modèle a ingérés. Si votre cas d’usage touche à des sujets clivants, attendez-vous à un alignement par défaut, et testez-le plutôt que de le présumer corrigé.

L’exception Gemini, et sa face cachée

Un modèle échappe au tableau. Gemini 3.1 Pro de Google a présenté les deux camps dans 93 % des cas. Seules 7 % de ses réponses étaient exclusivement à gauche, et aucune exclusivement à droite. Sur la question de savoir si les États-Unis devraient employer leur armée pour conquérir de nouveaux territoires, Gemini fut même le seul à formuler un argument en faveur de l’expansion.

Faut-il y voir un modèle « neutre » réussi ? Le chiffre dit surtout qu’un équilibrage volontaire est possible, mais qu’il se paie en réflexe systématique du « pour et contre ». Et l’enquête pointe une limite que les pourcentages masquent : sur certains sujets testés, la position dite de droite entre en conflit avec le consensus scientifique ou les droits humains fondamentaux. Exiger d’un modèle une « réponse conservatrice » revient alors à relativiser des faits établis. Ranger les réponses en deux colonnes « gauche » et « droite » est commode pour produire un chiffre ; ce n’est pas toujours une grille honnête.

Grok rappelle d’ailleurs que la mécanique reste pilotable au cas par cas. Sur les droits des personnes transgenres, et là seulement, le modèle a adopté une position exclusivement à droite, alignée mot pour mot sur les déclarations publiques de Musk. La preuve qu’une intervention ciblée sur la sortie est possible, sujet par sujet, là où le redressement global échoue.

Le Washington Post a publié son code complet et son analyse sur GitHub, ce qui permet de rejouer la mesure plutôt que de la croire sur parole. Reproduisez-la sur vos propres prompts métier : vous y lirez, mieux que dans n’importe quel argumentaire commercial, l’alignement réel du modèle que vous vous apprêtez à mettre entre les mains de vos utilisateurs.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *