- Midjourney vient d’adjoindre un modèle de diffusion image-to-video à son modèle de génération d’images. Le nouveau modèle, V1, permet de générer quatre vidéos de cinq secondes, sans son, à partir d’une image fixe fournie ou créée par Midjourney.
- Comme pour la génération d’images, les motion prompts, les invites qui contiennent les instructions de l’utilisateur, sont interprétées par un LLM dédié, qui transforme le texte libre en instructions formatées.
- Le premier modèle de diffusion avait été créé à partir de Stable Diffusion, et la firme britannique vient de lancer un modèle de génération vidéo (lire Qant du 23 novembre 2023), mais aucune indication n’a été donnée sur l’origine de V1.
- Midjourney facture la génération vidéo huit fois plus cher qu’une image, arguant d’une consommation de calcul sur GPU huit fois supérieure.
- EN FILIGRANE : Pendant ce temps, à Cannes… Midjourney met le pied dans un segment où les grands acteurs sont déjà clairement identifiés : Veo 3 de Google et Sora d’OpenAI réduisent progressivement l’espace de start-up pourtant bien ancrées, comme Runway ML, Pika Labs, la chinoise Kling… Par exemple, Youtube vient d’annoncer aux Lions, le festival de publicité qui vient de se conclure à Cannes, que la plateforme intégrera le modèle Veo 3 à ses Shorts. L’effet d’évangélisation pour le modèle de Google, techniquement le plus avancé du marché, devrait être à la mesure de l’audience concernée : chaque jour, les Shorts génèrent en moyenne 200 milliards de vues. Face à cette concurrence, Midjourney v1 semble plutôt pouvoir se comprendre comme une fonctionnalité de protection de l’existant, à l’instar d’Adobe Firefly. Ou comme une extension du domaine de l’image vers le GIF.
- À SURVEILLER : La revanche du droit d’auteur. Le lancement intervient une semaine après une plainte déposée par Disney et Universal (lire Qant du 13 juin), accusant Midjourney d’avoir généré des visuels de personnages protégés par le droit d’auteur. Elle s’ajoute à une class action de 2023, sur les images utilisées pour l’entraînement de ces modèles. Ce laboratoire privé, qui n’a jamais levé d’argent, a échappé une première fois à un procès d’envergure, en arguant du fait qu’il n’avait fait qu’adapter Stable Diffusion (lire Qant du 23 novembre 2023). L’excuse ne tient plus et Midjourney apparaît comme le maillon faible.
Midjourney s’anime enfin

La start-up de génération d’images par IA Midjourney dévoile son premier modèle de génération vidéo, V1, accessible uniquement via Discord.