Gemini Omni : Une Révolution dans la Création Vidéo par IA

Créer une image avec une intelligence artificielle n’est plus une innovation étonnante. Ce qui fait désormais la différence, c’est la capacité à modifier, prolonger et enrichir une idée initiale sans perdre le récit en cours de route. Dans le domaine de la vidéo, ce défi est encore plus complexe : il faut gérer le mouvement, le temps, la physique et des personnages tout en maintenant la cohérence. Gemini Omni promet d’aborder cette difficulté et de simplifier le processus d’édition vidéo.

Gemini Omni Flash : Une Famille de Création Vidéo

Google DeepMind invite à envisager Gemini Omni comme l’équivalent vidéo de Nano Banana, le générateur d’images qui a déjà captivé des millions d’utilisateurs. Le modèle Gemini Omni Flash est le premier d’une série conçue pour produire un contenu diversifié à partir de n’importe quelle entrée. Les utilisateurs pourront combiner images, audio, vidéo et texte pour générer des vidéos de haute qualité, enrichies par les données du monde réel que Gemini maîtrise.

Un Modèle de Vidéo Axé sur la Cohérence

L’une des caractéristiques les plus intéressantes de Gemini Omni réside dans son approche de l’édition vidéo. Plutôt que d’être un simple outil créant un clip à partir de zéro, Gemini Omni se positionne comme un système capable d’évoluer autour d’une scène en suivant des instructions séquencées. Google explique que les utilisateurs peuvent ajuster des détails comme l’esthétique, l’action, l’environnement et le style tout en garantissant la continuité des personnages et une physique cohérente.

Des Exemples Concrets d’Utilisation

Voici quelques prompts illustrant les possibilités de Gemini Omni :

  • “Make the sculpture out of bubbles.” (Transformez la sculpture en bulles.)
  • “When the person touches the mirror, make the mirror ripple beautifully like liquid.” (Lorsque la personne touche le miroir, faites-lui onduler joliment comme un liquide.)
  • “Claymation explainer of protein folding.” (Explication en claymation du repliement des protéines.)

Test Pratique avec la Puerta de Alcalá

Pour évaluer Gemini Omni, une première expérience a été réalisée avec une image emblématique : la Puerta de Alcalá à Madrid. Le prompt utilisé ? “Create a video from this image. Cars are moving forward and people are walking.” Ce test a mis en avant la capacité du modèle à animer une image statique, en intégrant des voitures en mouvement et des piétons tout en maintenant un fond sonore approprié.

Disponibilité et Limites d’Accès

Concernant l’accès, Gemini Omni Flash est accessible aux abonnés de Google AI Plus, Pro et Ultra, et sera déployé gratuitement sur YouTube Shorts et l’application YouTube Create. Cependant, un constat a été fait lors du test : après trois vidéos générées, un message a averti d’un plafond de création. Cela témoigne des exigences techniques et des ressources nécessaires pour produire des vidéos de qualité, suggérant que Google met en place une gestion progressive de l’accès.

Conclusion : L’Avenir de la Génération Vidéo par IA

Alors que Gemini Omni se positionne comme un acteur majeur dans la création de vidéos par IA, d’autres modèles comme Sora de OpenAI, qui ont évoqué de grandes promesses, n’ont pas su perdurer. Cela soulève une question cruciale : quel avenir pour la génération vidéo par IA et la capacité des utilisateurs à exprimer leur créativité ? Le lancement de Gemini Omni pourrait bien marquer un tournant décisif dans cette dynamique.



F1-ES