- Google DeepMind vient d’annoncer la formation d’une nouvelle équipe pour travailler sur des modèles d’intelligence artificielle capables de simuler des environnements physiques et virtuels. Cette équipe sera dirigée par Tim Brooks, ancien co-responsable du modèle vidéo Sora chez OpenAI, qui a rejoint Google DeepMind en octobre 2024.
- Le projet s’appuiera sur les travaux des équipes Gemini (modèles multimodaux, lire Qant du 7 décembre 2023), Veo (génération vidéo) et Genie, spécialisées dans la création de mondes 3D interactifs.
- Genie 2, présenté en décembre dernier, génère des environnements 3D en temps réel, avec des interactions physiques et des animations réalistes, pour des usages dans les jeux vidéo et l’entraînement de robots.
- EN FILIGRANE : De son côté, Nvidia a présenté plus tôt cette semaine Cosmos, une plateforme d'entraînement de robots par des vidéos de synthèse, qui comprend notamment des modèles de fondation pour générer des vidéos photoréalistes qui obéissent aux lois de la physique. L’entraînement de l’IA embarquée semble devenir l’un des premiers cas d’usage des world models.
- À SURVEILLER : L’utilisation des contenus YouTube. Google affirme avoir le droit d’entraîner ses modèles sur les vidéos YouTube, mais l’absence de transparence sur les vidéos spécifiques utilisées pourrait entraîner des litiges juridiques importants.
Google DeepMind explore les simulations réalistes avec l’IA
Google DeepMind entre dans le jeu des world models.