En quelques heures, la WWDC du 8 juin a accouché d’un verdict unanime : en adossant son nouvel assistant aux modèles Gemini de Google, Apple aurait signé l’aveu de son retard en intelligence artificielle. Le cadrage n’est pas faux. Mais il écrase une distinction qui change tout.
Car « dépendance » ne veut pas dire la même chose selon l’étage où elle se loge. Et c’est précisément là que la lecture dominante se trompe d’étage.
Ce qu’Apple a réellement annoncé
« Siri AI » n’est pas une mise à jour cosmétique, c’est une refonte de l’assistant : conversation multi-tours, prise en compte du contexte affiché à l’écran, exécution d’actions à travers les applications. Le tout repose sur la nouvelle génération d’Apple Intelligence et sur ses Apple Foundation Models (AFM), ses modèles maison.
Apple l’a confirmé sur scène : les modèles Gemini de Google viennent en complément. Et Google a publié dans la foulée un billet destiné aux développeurs de l’écosystème Apple, officialisant le volet plateforme de l’accord. Voilà pour le décor. Le vrai sujet commence après.
Professeur n’est pas moteur
L’image de « Siri qui tourne sous Gemini » suggère que le modèle de Google s’exécute dans votre poche à chaque requête. C’est faux. Selon les éléments techniques relevés par la presse spécialisée, les AFM de troisième génération n’embarquent aucun code Gemini à l’exécution.
Gemini intervient à deux étages bien distincts. D’abord comme modèle « professeur » à l’entraînement : c’est une distillation, où le grand modèle sert à générer les données et les signaux d’apprentissage du petit modèle embarqué. Ensuite comme modèle cloud, sollicité séparément pour les requêtes qui dépassent les capacités de l’appareil.
Le détail n’en est pas un. Une dépendance à l’entraînement est ponctuelle et réversible : changer de professeur à la génération suivante, c’est une décision d’achat, pas une migration. Une dépendance d’inférence, elle, se rejoue à chaque requête de chaque utilisateur, et engage la confidentialité, la latence et les coûts à chaque fois.
Apple s’est ménagé la première sur l’appareil. Elle a accepté la seconde dans le cloud. Deux choix de nature opposée, que le mot « dépendance » confond.
Ce que ça change pour qui orchestre l’IA
Pour quiconque assemble des modèles au quotidien, cette distinction est une grille de lecture, pas une anecdote Apple. Toute architecture qui mobilise un grand modèle pour en façonner un plus petit hérite de la même question : où loge vraiment ma dépendance ? Apple n’invente d’ailleurs rien : Google distille lui-même ses grands modèles Gemini pour en tirer le Gemini Nano embarqué sur Android, et la technique est devenue la norme pour faire tenir un modèle dans un téléphone.
- Une distillation est un actif figé : une fois le petit modèle entraîné, le professeur peut disparaître sans casser le produit. Le verrou est commercial, pas technique.
- Un appel d’API en inférence est un actif vivant : chaque utilisateur, chaque requête, rouvre la dépendance. Le verrou est permanent, et il se paie au volume.
- Confondre les deux dans un même tableau de risques, c’est surévaluer le réversible et sous-évaluer le récurrent.
Apple n’a pas capitulé. Elle a hiérarchisé ses renoncements : la main sur le modèle local, la sous-traitance de l’entraînement de pointe, et une concession sur l’inférence cloud. Trois décisions, trois niveaux de risque.
L’infrastructure, l’étage qui dérange
Le point sensible n’est donc pas la distillation. Il est plus bas, dans le silicium. D’après des informations de presse non confirmées par Apple, une partie de l’inférence cloud s’exécuterait sur des puces Nvidia Blackwell B200 hébergées chez Google.
Si cela se vérifiait, l’inflexion serait notable. Apple a bâti son Private Cloud Compute sur silicium maison précisément pour garder la chaîne d’inférence sous contrôle, du modèle jusqu’au métal. Faire transiter des requêtes Siri par du Nvidia logé dans des data centers Google, même encadré par contrat, déplace la frontière de ce contrôle.
C’est là, et non dans la salle de classe de la distillation, que la souveraineté technique d’Apple se discute vraiment.
Et l’Europe dans tout ça ?
Reste un dernier étage, réglementaire. Siri AI ne sera pas disponible dans l’Union européenne au lancement sur iPhone et iPad, alors qu’il arrivera sur macOS et visionOS. Apple invoque le DMA, estimant que l’interprétation des régulateurs l’obligerait à ouvrir aux systèmes d’IA tiers un accès quasi illimité à l’appareil, sans garde-fous suffisants.
« Nous sommes profondément déçus que nos utilisateurs européens n’aient pas Siri AI sur iPhone ou iPad », a déclaré Craig Federighi, sans avancer le moindre calendrier. Traduction pour le praticien européen : la pièce la plus visible de l’écosystème restera, pour un temps indéterminé, un objet qu’on observe de loin.
L’accord Apple-Google n’est donc pas une reddition. C’est une cartographie de dépendances, soigneusement étagée, où chaque renoncement répond à un calcul différent. Reste à voir lequel de ces étages, du professeur ou de l’infrastructure, Apple acceptera de remonter en premier le jour où le rapport de force changera.