Midjourney se lance à l'assaut de la génération de vidéo

En s'aventurant dans la génération vidéo, Midjourney vient marcher sur les plates-bandes de bon nombre d'acteurs, incluant Adobe, Google, Meta, OpenAI, Runway ou encore Stability AI pour ne citer qu'eux. Pour se démarquer, la start-up s'appuie sur les images générées dans sa plateforme et propose pour l'heure un accès illimité.

Partager
Midjourney se lance à l'assaut de la génération de vidéo

Si Midjourney a largement donné la priorité à l'image depuis son lancement en 2021, il tend aujourd'hui vers un autre type de contenu : la vidéo. "Nous pensons que l'évolution inévitable de cette technologie mène vers des modèles capables de simuler des mondes ouverts en temps réel". En clair, la start-up propose d'imaginer un système d’IA capable de générer des images en temps réel auquel il est possible de demander de se déplacer dans un espace en 3D, les environnements et les personnages bougent aussi, et l'utilisateur peut interagir avec tout cela.

L'année à venir sera donc consacrée à développer les briques nécessaires à ce système, incluant des modèles vidéo et des modèles 3D couplés au modèles d'image d'ores et déjà disponibles. Son premier modèle vidéo "V1", disponible uniquement sur le web, a donc été publié cette semaine. La start-up le considère comme "une étape intermédiaire", pour, à terme, offrir quelque chose de ludique, simple, esthétique et abordable.

Un workflow vidéo pour animer les images créées

Si les utilisateurs peuvent tranquillement continuer à créer des images dans Midjourney, ils peuvent aussi cliquer sur "Animer" pour les faire bouger. Deux options existent : d'une part, une animation automatique, où le système crée une "motion prompt" pour l'utilisateur et "fait juste bouger les choses". D'autre part, une animation manuelle, où l'utilisateur décrit lui-même au système comment il veut que la scène évolue et se déplace.

Deux niveaux de mouvement sont par ailleurs possibles : low motion - idéal pour les scènes d’ambiance, où la caméra reste stable et le sujet bouge lentement ou avec précision - et high motion - mieux pour les scènes dynamiques, où tout bouge, caméra comprise. Une fois la vidéo créée, il est possible de l'étendre (environ 4 secondes à la fois, et jusqu’à quatre fois, précise Midjourney). Enfin, pour ceux qui souhaiteraient importer des images extérieures à l'outil de génération d'images, cela est tout à fait possible.

Une tarification encore mal définie

Le coût réel de production de ces modèles, et les prix applicables sont difficiles à prévoir, assume Midjourney. Pour l'heure, la start-up compte donner l'accès dès maintenant à ses utilisateurs pour 10 dollars par mois, et prévoit d'ajuster les paramètres au fil des semaines à venir (et selon l’utilisation ou la saturation de ses serveurs) pour garantir un modèle économique viable.

Le coût d’un "travail vidéo" est environ 8 fois supérieur à celui d’une image, mais chaque job génère quatre vidéos de 5 secondes, explique Midjourney. Autrement dit : le coût d’une seconde de vidéo revient à peu près à celui d’une image agrandie, soit 25 fois moins cher que ce qui existe ailleurs sur le marché. La start-up prévoit en outre de tester un mode "relax vidéo" pour les abonnés "Pro" et supérieurs.

Si ce lancement est de bonne augure pour Midjourney, il pourrait faire de l'ombre aux acteurs déjà présents sur ce marché. Citons ainsi Adobe (Firefly), Google (Veo), Meta (Make-a-video), OpenAI (Sora), Runway (Gen4) ou encore Stability AI (Stable Video diffusion) qui ont plus ou moins une longueur d'avance en la matière. En ciblant davantage les métiers créatifs, Midjourney pourrait, à terme, réussir à s'imposer sur ce segment.

SUR LE MÊME SUJET

Sujets associés

NEWSLETTER L'Usine Digitale

Nos journalistes sélectionnent pour vous les articles essentiels de votre secteur.

Votre demande d’inscription a bien été prise en compte.

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes...

Votre email est traité par notre titre de presse qui selon le titre appartient, à une des sociétés suivantes du : Groupe Moniteur Nanterre B 403 080 823, IPD Nanterre 490 727 633, Groupe Industrie Service Info (GISI) Nanterre 442 233 417. Cette société ou toutes sociétés du Groupe Infopro Digital pourront l'utiliser afin de vous proposer pour leur compte ou celui de leurs clients, des produits et/ou services utiles à vos activités professionnelles. Pour exercer vos droits, vous y opposer ou pour en savoir plus : Charte des données personnelles.

CHERCHE TALENTS NUMERIQUE

Les formations USINE DIGITALE

Toutes les formations

ARTICLES LES PLUS LUS