Google étend l’édition d’images native alimentée par l’IA à l’application Gemini
Google continue son avancée dans le domaine de l’intelligence artificielle (IA) avec l’extension d’une fonctionnalité innovante d’édition d’images native à son application Gemini. Cette nouveauté permet aux utilisateurs de modifier des images directement via le chatbot IA, sans avoir à quitter l’application. Initialement lancée en mars dans la plateforme Google AI Studio, cette fonctionnalité repose sur le modèle avancé Gemini 2.0 Flash et offre une interaction conversationnelle pour transformer les images selon les souhaits de l’utilisateur.
Une intégration tardive mais ambitieuse dans le domaine de l’édition d’images
Bien que Gemini soit arrivé plus tardivement sur le marché de la génération d’images par IA, en comparaison avec des concurrents tels que ChatGPT, Copilot ou Midjourney, Google a rapidement déployé cette capacité. Après une pause en raison de la génération d’images parfois inexactes ou offensantes, Google a relancé cette fonction en décembre 2024 avec une version améliorée, Gemini 2.0 Flash.
Cette nouvelle mise à jour offre un accès progressif à la fonction d’édition native directement dans l’application Gemini, et sera disponible mondialement en plus de 45 langues, promettant une large accessibilité.
Des possibilités étendues d’édition d’images par conversation
Le point fort de cette fonctionnalité réside dans sa simplicité d’utilisation. Les utilisateurs peuvent soit modifier une image générée par l’IA, soit uploader une photo réelle puis demander à Gemini d’effectuer des ajustements spécifiques. Par exemple, on pourra demander d’ajouter des fleurs sur une table ou encore changer la couleur des cheveux sur un portrait.
Gemini peut gérer des modifications complexes telles que changer l’arrière-plan, remplacer ou ajouter des éléments dans l’image, et même retoucher des détails mineurs sur le sujet lui-même, ouvrant la porte à une créativité intuitive et personnalisée.
Encadrement éthique et prévention des abus
Conscient des risques associés, notamment la création de deepfakes, Google a intégré des mesures strictes dans son modèle pour refuser toute demande potentiellement offensante ou nuisible. En outre, toutes les images générées ou modifiées incluront un filigrane numérique invisible appelé SynthID. Un filigrane visible pourrait également être testé dans un futur proche pour renforcer la traçabilité des images issues de l’IA.
Cette initiative s’inscrit dans une démarche responsable visant à promouvoir une utilisation sûre et transparente de la technologie d’IA dans l’édition d’images.
👉 Source ici