Claude sur votre cloud : le pari souverain d’Anthropic

Claude sur votre cloud : le pari souverain d'Anthropic

Anthropic vient de déplacer le terrain de jeu. Depuis le 21 juin, les entreprises qui utilisent Claude Desktop via AWS, Google Cloud ou Microsoft Foundry disposent de l’expérience complète : chat, Claude Cowork et Claude Code dans une seule application. Le détail qui compte n’est pas la liste des fonctions. C’est l’endroit où elles s’exécutent.

L’inférence (le calcul qui génère les réponses du modèle) tourne désormais sur le cloud du client, dans les régions qu’il configure. L’historique des conversations reste stocké localement. Anthropic ne reçoit qu’une télémétrie agrégée que le client contrôle. Autrement dit : le modèle vient chez vous, vos prompts ne sortent plus.

Le frein n’a jamais été la qualité du modèle

Voilà des mois que la course aux benchmarks (ces tests de performance comparés) occupe le devant de la scène. Pendant ce temps, dans les directions informatiques des grands comptes, la vraie question n’a jamais bougé : où vivent les données quand un employé tape une requête ? Un service juridique, une banque, un acteur de la défense ne refusent pas Claude parce qu’il raisonne mal. Ils le refusent parce qu’ils ne savent pas où atterrit le contenu sensible que leurs équipes y déversent.

Anthropic attaque ce verrou de plein fouet. En faisant transiter l’inférence par l’environnement cloud déjà validé par le client, l’éditeur retire l’argument numéro un des comités de sécurité. Le calcul reste dans le périmètre de conformité existant, sous les régions et les certifications que l’entreprise a déjà négociées avec son hébergeur.

Un coup joué contre qui, exactement ?

Lu comme un déplacement sur l’échiquier, le mouvement vise deux adversaires à la fois. Face à OpenAI et Google, Anthropic transforme un terrain où il était challenger (la distribution grand public) en terrain où il peut gagner : l’entreprise réglementée, celle qui paie cher et signe des contrats longs. La nuance n’est pas que rhétorique : chez OpenAI, la résidence des données de ChatGPT Enterprise concerne avant tout le stockage, mais l’inférence reste par défaut traitée sur des serveurs américains. Ici, c’est le calcul lui-même qu’Anthropic déplace chez le client.

Mais le coup le plus malin se joue avec ses propres hébergeurs. En s’appuyant sur AWS, Google Cloud et Microsoft Foundry plutôt que de pousser sa propre infrastructure, Anthropic se branche sur des relations commerciales que les DSI (directions des systèmes d’information) entretiennent déjà. Le témoignage glissé dans l’annonce le dit sans détour.

« Nous avons déployé Claude Desktop rapidement via notre environnement cloud existant, sans contrat fournisseur séparé. Notre propre passerelle LLM a permis à une seule équipe de le déployer auprès de centaines d’utilisateurs dans le monde, sans chantier d’infrastructure lourd », résume Sarang Oh, responsable de l’équipe Analytics/IA chez Hanwha Solutions.

Pas de nouveau contrat, pas de nouvelle facture à faire valider : le frein achat tombe en même temps que le frein sécurité.

La mécanique qui désamorce les objections

Le dispositif est pensé pour ressembler à n’importe quelle application d’entreprise, et c’est là sa force. Les salariés se connectent avec leur compte de travail habituel, via les annuaires d’identité de l’entreprise : IAM Identity Center, Workforce Identity Federation, Microsoft Entra ID ou n’importe quel fournisseur OIDC (le standard d’authentification OpenID Connect) comme Okta. Aucune clé partagée à faire tourner, aucun identifiant cloud sur les postes.

Côté déploiement, les administrateurs exportent des modèles de politique depuis l’interface de configuration et les poussent via Intune, GPO ou Jamf, exactement comme un logiciel managé. Un installeur hors ligne couvre les environnements isolés (air-gapped). Et un garde-fou de routage maintient les requêtes sur Claude, y compris en GovCloud, même si un réglage est mal posé.

Le découpage le plus stratégique se trouve dans les clés de politique séparées. Chat, Cowork et Claude Code s’activent indépendamment :

  • le chat pour les réponses rapides et la mise en forme d’un problème ;
  • Claude Cowork pour les tâches déléguées : recherche dans les sources approuvées, travail sur les fichiers déjà présents sur le poste, production du livrable ;
  • Claude Code pour les ingénieurs qui veulent du développement agentique (l’IA qui exécute des tâches de programmation en autonomie) sans vivre dans un terminal.

On donne le chat et Cowork aux équipes non techniques, Claude Code à l’ingénierie, puis on élargit. C’est une stratégie d’adoption graduelle déguisée en réglage d’administration. Et les règles de blocage strict s’appliquent partout, quel que soit l’onglet.

Là où le bât peut blesser

Reste que faire tourner l’inférence chez le client déplace la complexité plus qu’il ne la supprime. C’est désormais à l’entreprise de vérifier quels modèles Claude son hébergeur sert réellement, de tester chaque connecteur et de valider la connexion avant tout déploiement. La promesse de souveraineté a un prix : la charge de validation revient en interne.

Le connecteur Microsoft 365 illustre la nuance. Il donne à Claude accès aux mails et documents via votre propre application Entra, avec liste blanche par tenant et un support en bêta pour les environnements GCC High et DoD (les clouds gouvernementaux et de défense américains). Pour les exigences de résidence les plus strictes, un connecteur local garde l’échange entre le poste et Microsoft. Le mot « bêta » rappelle que les cas les plus sensibles, ceux que cette annonce vise précisément, ne sont pas encore tous au point.

Le message d’Anthropic est clair : la bataille de l’IA en entreprise ne se gagnera pas sur un point de benchmark de plus, mais sur la capacité à faire entrer un modèle puissant dans des environnements qui jusqu’ici claquaient la porte. En portant le calcul là où vivent déjà les données, l’éditeur ne vend plus seulement un modèle. Il vend l’autorisation de l’utiliser.

Reste une question que les concurrents vont devoir trancher vite : combien de temps peut-on encore défendre une architecture où les prompts des clients transitent par l’infrastructure du fournisseur, quand le voisin propose l’inverse ?

Sources

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *