Google améliore son IA de génération d'images. L’entreprise a annoncé que son app Gemini embarquait un tout nouveau modèle appelé nano-banana, bien plus fort pour mélanger plusieurs images ou pour les retoucher sans les modifier en profondeur. Mountain View affirme qu’il s’agit du modèle d'édition d'images le mieux noté au monde en se basant sur la page de comparaison de LMArena. Selon ses benchmarks, il dépasse l’équivalent d’OpenAI intégré à ChatGPT.
Ce nano-banana (ou Gemini 2.5 Flash Image) peut modifier un portrait tout en gardant correctement la représentation du corps et du visage. Google invite les curieux à demander une photo d’eux dans une tenue particulière ou à une autre époque, et vante une excellente cohérence des personnes représentées au fil des modifications. « Notre dernière mise à jour est conçue pour que les photos de vos amis, de votre famille et même de vos animaux de compagnie leur ressemblent toujours », explique l’entreprise dans son communiqué.
Cette meilleure cohérence rend plus faciles certaines actions jusqu’à présent réservées à des outils comme Photoshop : on peut demander au modèle de changer la couleur d’un vêtement, de supprimer une tache ou d’enlever une personne d’une photo. Sur d’autres modèles, une telle commande pourrait amener à un arrière-plan déformé ou à un visage modifié. En plus de cela, nano-banana est présenté comme très efficace pour mélanger deux photos, ce qui sera par exemple pratique pour voir ce que donnerait un meuble dans son salon.
Si vous voulez l’essayer, Google propose une expérience pour retoucher une photo et une autre pour faire évoluer une photo dans le temps. Une dernière permet d’ajouter un objet (ou une personne) à une scène. Elle est aussi active dans l’app Gemini pour iOS, pour les abonnés comme pour les utilisateurs gratuits.
La génération d’image est devenue un point crucial des services d’IA génératives. Le lancement d’un nouveau modèle chez OpenAI en avril dernier avait créé un gros afflux de curieux, menant l’entreprise à le débrancher temporairement pour les utilisateurs gratuits. Le Grok d’Elon Musk a fait parler de lui pour son absence de garde-fou et la présence d’un mode de génération de vidéos, ce qui l’a fait grimper dans les classements de l’App Store.