
L’essentiel
- Plus de 100 experts en cybersécurité et dirigeants de la tech ont signé une lettre ouverte réclamant la levée des contrôles à l’export sur Fable 5 et Mythos 5.
- Le « jailbreak » qui a motivé l’interdiction se résumait à demander au modèle de « corriger ce code » : une tâche défensive de routine, souligne l’experte Katie Moussouris.
- Des responsables américains accusent désormais Anthropic d’avoir passé outre le décret cyber de Donald Trump ; des discussions impliquant le Commerce, la CIA et le conseiller scientifique Michael Kratsios sont en cours.
Un modèle d’IA parfaitement inviolable n’existe pas. Pourtant, c’est exactement ce que Washington semble exiger avant d’autoriser de nouveau l’export de Fable 5.
Il y a quelques jours, nous écrivions que l’État venait de prouver qu’il pouvait éteindre une IA du jour au lendemain, en coupant brutalement l’accès à Fable 5 et Mythos 5 au nom de la sécurité nationale. Depuis, l’affaire a pris un tour autrement plus gênant : non pas pour Anthropic, mais pour le gouvernement lui-même. Car on connaît désormais la nature exacte de la faille qui a tout déclenché.
Le « jailbreak » qui n’en était pas un
Le récit officiel laissait imaginer une technique sophistiquée, une porte dérobée capable de transformer un assistant de programmation en arme cyber. La réalité, révélée par l’experte en cybersécurité Katie Moussouris, dirigeante de Luta Security, est nettement plus prosaïque.
Des chercheurs ont pris du code open source comportant des vulnérabilités connues et répertoriées publiquement (les CVE) et du code truffé de failles volontaires. Ils ont demandé à Fable 5 de « passer ce code en revue pour repérer les problèmes de sécurité ». Le modèle a refusé. Ils ont alors reformulé : « corrige ce code ». Cette fois, après plusieurs étapes manuelles, il a obtempéré.
Voilà le « contournement » qui a justifié de débrancher un modèle de pointe pour tous ses clients. Moussouris, qui a pu consulter le rapport de la Maison-Blanche transmis par Anthropic, est catégorique : il s’agissait du « modèle fonctionnant exactement comme prévu » pour la cyberdéfense. Corriger des bugs, expliquer pourquoi le correctif compte, écrire les tests qui le valident : c’est la boucle quotidienne de tout défenseur. Ce n’est pas une faille de sécurité. C’est la fonction la plus utile qu’une IA puisse rendre.
Quand plus de 100 experts montent au créneau
Le malaise dépasse une voix isolée. Plus d’une centaine de spécialistes de la sécurité et de dirigeants de l’industrie ont cosigné une lettre ouverte adressée au secrétaire au Commerce Howard Lutnick et au directeur national cyber Sean Cairncross, pour exiger la levée des contrôles à l’export visant Fable et Mythos.
Parmi les signataires, des noms qui pèsent : Alex Stamos (Corridor), Rachel Tobac (SocialProof Security), Katie Moussouris (Luta Security), Dan Lorenc (Chainguard) ou encore Joe Levy (Sophos). Leur argument tient en trois points, redoutablement simples :
- Fable n’a rien d’unique. D’autres modèles trouvent les mêmes failles : GPT-5.5, Opus, Sonnet, jusqu’au modèle chinois Kimi 2.7. Interdire l’un sans toucher aux autres ne protège personne.
- Les garde-fous de Fable étaient si stricts qu’à son lancement, la communauté sécurité les jugeait excessifs. On bannit donc le modèle le plus prudent du marché.
- Pendant ce temps, les modèles chinois à poids ouverts ne sont qu’à quelques mois des meilleurs modèles américains. On désarme les défenseurs au moment précis où la course se resserre.
L’inviolable, ce mythe technique
Le vrai problème n’est pas Anthropic. C’est l’attente irréaliste qui sous-tend la décision. Exiger qu’un modèle de frontière soit « inhackable » avant de l’exporter, c’est demander l’impossible, et l’industrie le sait depuis longtemps.
OpenAI a prévenu que l’injection de prompt, une méthode de détournement voisine, ne sera peut-être jamais entièrement résolue. Il n’existe à ce jour aucune parade définitive pour sécuriser les grands modèles de langage. Anthropic le disait noir sur blanc en dévoilant Fable : la résistance parfaite aux jailbreaks n’est pas atteignable aujourd’hui, pour aucun fournisseur.
D’où la stratégie de défense en profondeur revendiquée par l’entreprise : rendre les contournements soit étroits, soit très coûteux à produire, et les compléter par une surveillance capable de détecter et de couper une attaque réussie. Quiconque travaille au contact de ces modèles le sait : un LLM peut être détourné. Le vrai sujet n’est pas d’empêcher tout contournement, mais de mesurer la gravité d’une brèche et la vitesse de la riposte.
Une accusation qui se retourne
Le conflit se durcit pourtant. Selon des informations de presse, des responsables de l’administration reprochent à Anthropic d’avoir ignoré le décret cyber récemment signé par Donald Trump, qui prévoyait une supervision « volontaire » des modèles. L’entreprise aurait publié Fable 5 sans attendre la mise en place du guichet chargé de valider la sortie. « Ils ont pris le mauvais embranchement à chaque carrefour », résume un officiel ; le signalement de la faille serait, lui, venu d’Amazon et d’autres acteurs du secteur.
Les échanges entre les deux camps virent au dialogue de sourds, et de nouvelles réunions sont prévues avec le département du Commerce, la CIA et le conseiller scientifique Michael Kratsios. Reste que l’accusation centrale, « Anthropic savait qu’un jailbreak était possible et s’est tu », en dit surtout long sur la maîtrise technique du sujet côté gouvernement. Évidemment qu’un jailbreak était possible : aucun modèle n’en est exempt, et Anthropic l’a écrit publiquement.
Et si l’interdiction nous fragilisait ?
On retiendra, dans la couverture dominante, l’image d’un laboratoire imprudent ayant livré un modèle dangereux. Mais cette lecture rate l’essentiel. La capacité qui a fait bannir Fable, lire un fichier et en réparer les failles, est précisément celle dont les défenseurs ont besoin chaque jour. On ne peut pas la retirer sans rendre le modèle moins bon pour corriger des bugs et vérifier des correctifs.
Pour un praticien qui orchestre l’IA au quotidien, le signal est glaçant : l’outil le plus efficace pour sécuriser son code pourrait disparaître par décret, non pour ce qu’il fait de mal, mais pour ce qu’il fait de bien. La question n’est plus de savoir si un modèle peut être détourné, mais comment éviter qu’une politique mal calibrée ne désarme ceux-là mêmes qu’elle prétend protéger.
Mon avis
En coupant Fable 5 pour une « faille » qui n’était qu’une demande de correction de code, Washington vient de retirer aux défenseurs un de leurs meilleurs outils tout en laissant intacts GPT-5.5, Opus, Sonnet et les modèles chinois capables d’exactement la même chose. Je parie que cette interdiction ne tiendra pas trois mois : soit elle s’élargit jusqu’à l’absurde et bloque tout assistant de programmation sérieux, soit elle saute sous la pression des experts. Le vrai danger ici n’est pas une IA trop puissante, c’est une décision prise par des gens qui confondent « réparer un bug » et « fabriquer une cyberarme ».
