
L’essentiel
- Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image) sort une image en 4 secondes pour 0,034 dollar en résolution 1K.
- Gemini Omni Flash arrive dans l’API Gemini et Google AI Studio pour la génération et l’édition vidéo conversationnelle.
- Via l’API Interactions, les deux modèles se chaînent : générer une image, l’animer, puis empiler jusqu’à trois retouches dans la même session.
Google DeepMind a posé deux nouvelles pièces sur l’échiquier de la génération visuelle, et aucune ne joue la carte du chef-d’œuvre. Nano Banana 2 Lite et Gemini Omni Flash sont taillés pour un seul usage : produire de l’image par milliers, vite et pour presque rien.
Quatre secondes et trois centimes par image
Nano Banana 2 Lite, de son nom d’API gemini-3.1-flash-lite-image, produit une image en quatre secondes pour 0,034 dollar en résolution 1K (environ 1 000 pixels de côté). Google le présente sans détour comme le remplaçant recommandé de la première version de Nano Banana (gemini-2.5-flash-image) : les développeurs peuvent basculer dès aujourd’hui, sur Google AI Studio, l’API Gemini et jusque dans la recherche et l’application Gemini.
Ce n’est pas le modèle le plus doué de la maison, et Google ne le cache pas. Il conserve une fidélité au prompt correcte, une bonne cohérence des personnages d’une image à l’autre et un rendu lisible du texte inséré dans l’image. Son argument tient ailleurs : la latence et le coût. Anish Nangia, product manager chez Google DeepMind, le décrit comme un outil taillé pour les pipelines à haut débit, là où la vitesse et le prix priment sur tout le reste.
Chaîner l’image et la vidéo dans la même session
Le second lancement complète le premier. Gemini Omni Flash, jusqu’ici réservé aux applications grand public de Google, débarque dans Google AI Studio et l’API Gemini pour la génération et l’édition vidéo conversationnelle : on décrit une retouche en langage naturel, le modèle l’applique.
L’articulation entre les deux est le cœur de la manœuvre. Via l’API Interactions, un développeur génère une image avec Nano Banana 2 Lite, puis l’anime immédiatement avec Omni Flash, sans quitter la session. Mieux : l’historique de session se conserve, ce qui autorise d’empiler jusqu’à trois modifications successives sur le même contenu. Image, animation, retouche : la chaîne complète tient dans un seul flux d’API.
Trois paliers, du brouillon jetable au rendu soigné
Avec ce lancement, la famille Nano Banana s’organise en trois étages nettement séparés. Nano Banana 2 Lite occupe le bas : vitesse et volume. Nano Banana 2 (Gemini 3.1 Flash Image) joue le généraliste, meilleur équilibre entre qualité, latence et coût. Nano Banana Pro (Gemini 3 Pro Image) vise le haut du panier, les cas professionnels complexes où la précision et le raisonnement priment.
Ce découpage n’a rien d’anodin. Il calque la logique tarifaire du cloud sur la création d’images : à chaque besoin son palier. Le message aux développeurs est limpide : commencez au moins cher, montez en gamme seulement quand le cas l’exige.
Le terrain que Google cherche à verrouiller
Brader ainsi l’image générée répond à un calcul précis. La valeur a migré du rendu unique vers le volume et l’ancrage. En faisant de son modèle le moins cher le remplaçant par défaut, et en rendant l’enchaînement image-vidéo natif à son API, Google déplace la concurrence là où il domine : l’infrastructure. Les comparatifs qu’il publie face aux modèles rivaux mesurent d’ailleurs autant la latence et le coût par image que la qualité de sortie.
Un développeur qui bâtit sa production visuelle sur l’API Interactions ne compare plus modèle par modèle. Il s’installe dans un écosystème où générer un millier d’images, les animer et les retoucher relève d’un seul appel chaîné. C’est moins un lancement de produit qu’une prise de position : capter le flux de travail, pas le trophée.
Mon avis
La course au plus beau pixel est en train de devenir un marché de niche. Le nerf de la guerre visuelle, ce sera le coût marginal proche de zéro et la capacité à enchaîner les étapes sans friction, et Google vient de dégainer les deux d’un coup. Ses concurrents qui misent encore sur le rendu spectaculaire défendent un territoire dont la majorité des usages professionnels n’a même pas besoin. Leur risque n’est pas de perdre le concours de beauté : c’est de le gagner pendant que Google rafle la tuyauterie.
