Google a présenté Nano Banana Pro, une évolution de son modèle de génération et d'édition d'images construite sur Gemini 3 Pro. Le propos est d'aller au‑delà d'un simple rendu visuel pour produire des images « utiles » et étayées, capables d'intégrer des connaissances en temps réel et de mieux gérer le texte et la cohérence visuelle.
Ce que propose Nano Banana Pro
Selon Google, Nano Banana Pro enrichit la version précédente par plusieurs capacités nouvelles ou renforcées :
- aptitude au raisonnement et accès direct aux connaissances de Google Search pour intégrer des informations actualisées dans les visuels ;
- meilleure fidélité visuelle et cohérence lors du mélange d'éléments graphiques, y compris la préservation de la ressemblance jusqu'à cinq personnes ;
- capacité à combiner jusqu'à 14 images pour nourrir une création unique ;
- amélioration du rendu du texte à l'intérieur des images (textes longs, polices stylisées, mockups et contenu localisé) visant une meilleure lisibilité ;
- nouveaux contrôles créatifs : édition localisée, réglages d'angle de caméra, d'éclairage et de profondeur de champ ;
- possibilité d'exporter dans plusieurs rapports d'aspect et en résolutions allant jusqu'à 2K/4K.
Le modèle est destiné à produire non seulement des illustrations mais aussi des contenus applicables tels que infographies, diagrammes, recettes ou captures intégrant des informations sourcées.
Déploiement et accès dans l'écosystème Google
Nano Banana Pro est annoncé comme déployé à travers l'écosystème Google. Concrètement, il apparaît dans l'application Gemini sous l'option « Thinking » et dans le mode IA de Search pour certains abonnements aux États‑Unis. L'intégration est prévue ou annoncée pour des produits professionnels tels que Google Ads, Workspace (Slides, Vids) et Flow, un outil destiné au cinéma.
Les développeurs devraient pouvoir y accéder via plusieurs interfaces : la Gemini API, Google AI Studio, Antigravity et Vertex AI. L'accès varie selon le niveau d'abonnement (Free, AI Plus, Pro, Ultra) et les quotas seraient différenciés selon ces paliers.
Transparence, traçabilité et limites actuelles
Pour répondre aux enjeux de confiance, Google indique vouloir maintenir des dispositifs de traçabilité. Les images générées continueront d'utiliser le marquage SynthID et les utilisateurs pourront interroger l'application Gemini pour savoir si une image provient d'une génération Google, sur la base des signaux SynthID. Par ailleurs, les images issues des paliers Free et Pro porteront un filigrane visible « Gemini », qui serait retiré pour les abonnés Ultra et certains comptes développeurs.
Ces mesures visent à informer les destinataires sur l'origine des images et à limiter les usages trompeurs. Elles ne suppriment cependant pas la nécessité d'évaluer la fiabilité des informations intégrées par le modèle, notamment lorsque celles‑ci proviennent de sources externes à jour.
Ce qui reste à confirmer
Plusieurs détails opérationnels et temporels demeurent à préciser ou à confirmer par Google : les dates et l'étendue du déploiement international, la répartition exacte des quotas par palier, les critères déterminant quels développeurs seront exemptés du filigrane, et les modalités précises de vérification via SynthID dans les différents outils.
À retenir
- Nano Banana Pro est une version renforcée axée sur le raisonnement et l'intégration de connaissances en temps réel via Google Search.
- Le modèle améliore la gestion du texte, la cohérence multi‑éléments, et offre des contrôles créatifs (angle, éclairage, profondeur) et exports jusqu'à 2K/4K.
- Déploiement prévu dans Gemini, le mode IA de Search et des outils professionnels (Ads, Workspace, Flow) ; accès via plusieurs APIs et plateformes pour développeurs.
- Google prévoit des dispositifs de traçabilité (SynthID, filigranes) avec des différences selon les niveaux d'abonnement.
- Des précisions restent attendues sur le calendrier, les quotas et les règles d'exemption du filigrane.
Article amélioré avec l'IA - Article original