Le 16 décembre, OpenAI a présenté une nouvelle version de son offre d'images intégrée à ChatGPT, basée sur un modèle d'image dit « premium » et accessible via l'API sous le nom GPT Image 1.5. Conçue pour accélérer la création visuelle et améliorer la fidélité des retouches, cette évolution vise à transformer un smartphone ou un navigateur en un outil de production visuelle pratique pour des usages professionnels et créatifs.

Contexte et principales nouveautés

La mise à jour introduit un moteur d'image déployé progressivement pour la majorité des utilisateurs de ChatGPT, tandis que l'API porte le nom GPT Image 1.5. OpenAI indique que le modèle offre des temps de génération plus rapides et une meilleure cohérence visuelle. Une interface dédiée aux images a été intégrée à la barre latérale de l'application mobile et à chatgpt.com afin de faciliter la navigation entre essais et variantes.

Fonctionnalités pratiques et gains attendus

La nouveauté se distingue par plusieurs comportements notables lors de la modification d'une photo importée : le modèle conserve l'éclairage, la composition et les traits principaux de l'image d'origine tout en appliquant des changements ciblés demandés par l'utilisateur. Parmi les usages mis en avant figurent :

  • retouches ciblées sans altérer l'identité visuelle de l'image ;
  • simulation réaliste de coiffures et de vêtements ;
  • application de filtres de style qui préservent les éléments essentiels du visuel ;
  • transformations créatives permettant d'ajouter ou de remodeler textes et mises en page tout en maintenant les détails importants.

L'interface propose aussi de nombreux préréglages et idées intégrés, destinés à faciliter l'expérimentation sans rédiger de longues consignes. Ces préréglages devraient être mis à jour en fonction des tendances pour rester pertinents.

Impact pour les entreprises et aspects économiques

OpenAI présente GPT Image 1.5 comme un outil susceptible d'optimiser des flux de travail en marketing, e‑commerce ou communication interne. Le modèle est décrit comme plus fidèle aux instructions et meilleur pour rendre de petits textes et de multiples visages. Côté coûts, l'éditeur annonce une réduction d'environ 20 % des coûts d'entrée/sortie pour l'image via l'API par rapport à la version antérieure, ce qui permettrait de multiplier les itérations pour un même budget.

Limites, fiabilité et évolution attendue

OpenAI reconnaît des progrès notables sur des exemples anciens, mais admet qu'il existe encore des marges d'amélioration. L'éditeur signale que l'expérience utilisateur sur ChatGPT démarre pour la plupart des comptes dès à présent, tandis que les comptes Business et Enterprise devront attendre un déploiement ultérieur.

Ce qui reste à confirmer : la roadmap précise de déploiement pour les comptes professionnels, la fréquence et la portée des mises à jour des préréglages, ainsi que des mesures chiffrées indépendantes de la qualité de rendu sur des cas d'utilisation variés. De même, les détails sur les politiques d'utilisation, la gestion des droits d'image et les garanties en matière de sécurité et d'éthique n'ont pas été précisés dans les éléments communiqués.

À retenir

  • OpenAI a lancé GPT Image 1.5 pour ChatGPT, annoncé le 16 décembre et disponible progressivement pour la plupart des utilisateurs.
  • Le modèle privilégie la conservation de l'éclairage et de la composition lors des retouches et propose des préréglages pour simplifier la création.
  • Améliorations techniques ciblées : fidélité aux instructions, rendu de petits textes et de visages multiples, génération plus rapide.
  • Coût API réduit d'environ 20 % pour les images d'entrée/sortie par rapport à la version précédente.
  • Des incertitudes subsistent sur le calendrier exact pour les comptes Business/Enterprise et sur certains aspects opérationnels et réglementaires.

Article amélioré avec l'IA - Article original