"Créer n'importe quoi à partir de n'importe quoi": Google présente Gemini Omni, une IA capable de générer des vidéos à partir de texte, d’images et de sons

L'essentiel de l'article

⏱️ Lecture : ~30 secondes

Pas le temps de lire l'article ? Voici ce qu'il faut retenir.

Google présente Gemini Omni Flash, un modèle d'IA capable de créer ou transformer des vidéos à partir de texte, d’images, de sons ou même de son propre avatar.

Gemini Omni Flash — Le modèle accepte plusieurs types d'entrées simultanément, notamment des vidéos, des images, des textes et des éléments audio.

Capacités multimodales — Le modèle pourra également générer des images et de l'audio à terme.

Cohérence visuelle — L'IA conserve une cohérence visuelle entre plusieurs modifications successives, grâce à sa connaissance du "monde réel".

💡

Pourquoi c'est important : Cette nouvelle technologie pourrait révolutionner la création de contenus visuels et permettre la génération de vidéos explicatives à partir de courtes consignes textuelles.

Lire sur BFM