Cinéma et IA : ce que DeepMind a changé à Tribeca

Cinéma et IA : ce que DeepMind a changé à Tribeca

On nous répète depuis deux ans que l’IA générative va engloutir Hollywood. Le festival de Tribeca 2026 raconte une histoire plus intéressante : la technologie ne fait rien de mémorable toute seule.

Le récit dominant oscille entre deux caricatures. D’un côté, la promesse d’une industrie du film entièrement automatisée, où il suffirait de taper une consigne pour générer un long-métrage. De l’autre, le rejet en bloc : l’IA ne produirait que du « slop », ces rafales de vidéos incohérentes qu’OpenAI ou xAI ont déversées sur internet. Les deux camps passent à côté de l’essentiel.

Ce que Tribeca a vraiment montré

Plusieurs films présentés au festival illustrent l’écueil habituel du contenu généré : sans direction, ça reste sans vie. Des courts comme Roar ou ChikaBOOM! ressemblaient davantage à un montage désorienté de plans assemblés qu’à un véritable objet de cinéma. La limite n’était pas le talent des équipes, mais le pipeline lui-même, pensé autour de l’outil plutôt que l’inverse.

Deux projets ont tranché avec ce lot. Mauvais Soleil, soutenu par OpenAI, et surtout Dear Upstairs Neighbors, réalisé en collaboration avec les chercheurs de Google DeepMind. Ce dernier raconte une histoire simple : une jeune femme épuisée, Ada, tente de dormir, sans cesse réveillée par le vacarme de ses voisins du dessus. Rien de spectaculaire sur le papier. Tout dans l’exécution.

Le métier d’abord, le modèle ensuite

Le court est écrit et réalisé par Connie Qin He, vétérane de Pixar. Pour donner au film son identité visuelle, elle a fait appel à un autre profil maison, le directeur artistique Yingzong Xin, qui a peint des concept arts à la main : Photoshop, papier, acrylique, une esthétique expressionniste et picturale.

Et c’est là que tout se joue. Ce style peint est précisément le cauchemar des modèles de génération vidéo standards : impossible d’en tirer des plans visuellement cohérents d’une image à l’autre. Un prompt jeté dans un modèle grand public aurait produit la bouillie habituelle.

La solution de DeepMind n’a pas été de mieux formuler la consigne. Ses ingénieurs ont développé des versions sur mesure de leurs modèles Veo (génération vidéo) et Imagen (génération d’images), entraînées sur les concept arts de Xin. Conséquence directe : les modèles pouvaient produire des plans fidèles à la vision de la réalisatrice, dans son style, avec des outils de réglage fin pour ajuster chaque sortie.

Le résultat ? Une œuvre qui tient parce qu’un artiste l’a dirigée bout à bout, pas parce qu’une IA l’a devinée.

Prompt jetable contre direction artistique

Voilà le vrai déplacement que cette actualité révèle. Le clivage pertinent n’est plus « génératif contre humain ». Il est devenu : prompt jetable contre direction artistique.

Dans le premier régime, l’utilisateur est un distributeur de consignes. Il décrit, le modèle improvise, et le hasard fait le reste : c’est le terrain du slop. Dans le second, l’humain reste réalisateur au sens plein du terme. Il fixe une intention, façonne la matière d’entraînement, contraint le modèle à servir une vision au lieu de la diluer.

  • Le distributeur de prompts délègue le goût à la machine et récolte une moyenne statistique.
  • Le réalisateur garde le goût, et n’utilise le modèle que comme un instrument accordé sur sa partition.

La différence ne se voit pas dans la fiche technique du modèle. Elle se voit à l’écran.

Pourquoi ça parle à qui orchestre l’IA

Cette leçon dépasse largement le cinéma, et c’est ce qui devrait intéresser quiconque pilote des modèles au quotidien. Le réflexe du marché reste de courir après le modèle le plus puissant, comme si la performance brute suffisait : OpenAI pousse ainsi un modèle généraliste comme Sora 2, capable de produire une vidéo à partir d’une seule consigne, là où DeepMind a fait le pari inverse en entraînant des modèles dédiés sur la matière d’un seul artiste. Tribeca rappelle où se niche la valeur : elle se déplace vers la couche d’orchestration, là où un métier décide quoi entraîner, sur quelles données, avec quels garde-fous et quels outils de reprise en main.

Gardons toutefois la mesure. L’approche de DeepMind reste artisanale et coûteuse : entraîner des modèles dédiés sur les œuvres d’un directeur artistique précis n’a rien d’une recette industrialisable demain pour tout studio. Plusieurs grands partenariats entre Hollywood et la Silicon Valley se sont d’ailleurs évaporés ces derniers mois, signe que la promesse d’une révolution clé en main ne tient pas encore. Le format court n’est pas non plus un long-métrage rentable.

Pour autant, la trajectoire est lisible. Ce que ces projets démontrent, ce n’est pas que l’IA sait faire du cinéma, c’est qu’un cinéaste peut faire de l’IA un pinceau au lieu d’un automate. Le modèle n’apporte rien ; le métier qui le dirige apporte tout.

L’outil ou la main qui le tient ?

On a passé deux ans à demander si l’IA générative remplacerait les créateurs. La question était mal posée. La vraie interrogation n’est pas de savoir si la machine peut créer seule, mais qui tiendra la barre quand elle créera.

Tant que l’industrie confondra la puissance du modèle avec la qualité de l’œuvre, elle continuera de produire du slop en série. Le jour où elle comprendra que l’outil ne vaut que par la main qui le dirige, le débat sur l’IA et la création changera enfin de nature. Reste à voir combien de studios accepteront de remettre le métier, et non le prompt, au centre du plateau.

Sources

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *