Gemini, à l’épreuve des faits

"Les drôles d'illustrations de Google" (Qant, M. de R. avec Midjourney)

Google a réactivé la génération d'images via son chatbot Gemini, en se basant sur le modèle Imagen 3, après l'avoir suspendue pour des inexactitudes historiques.

Google vient de réactiver la fonction de génération d'images de personnes via son chatbot Gemini, après l'avoir suspendue en raison d'images historiquement inexactes, comme des soldats nazis noirs (lire Qant du 23 février).

Cette fonctionnalité, alimentée par le modèle Imagen 3, sera accessible en avant-première aux utilisateurs professionnels et entreprises de Gemini. Des restrictions sont en place pour empêcher la création d'images réalistes de figures publiques, de mineurs, ou de contenus inappropriés.

À SURVEILLER. Le problème de Google cet hiver ne provenait pas d’hallucinations du modèle, qui serait sorti des lignes tracées, mais au contraire d’une interprétation trop stricte des normes contre les biais de l’IA. Celles-ci conduisaient le modèle à s’écarter de la réalité historique. Demis Hassabis, CEO de Google Deepmind, avait promis de travailler à la “factualité” du modèle avant de le remettre en fonction.

L’essentiel