"Créer n'importe quoi à partir de n'importe quoi": Google présente Gemini Omni, une IA capable de générer des vidéos à partir de texte, d’images et de sons
Pas le temps de lire l'article ? Voici ce qu'il faut retenir.
Google présente Gemini Omni Flash, un modèle d'IA capable de créer ou transformer des vidéos à partir de texte, d’images, de sons ou même de son propre avatar.
1
Gemini Omni Flash — Le modèle accepte plusieurs types d'entrées simultanément, notamment des vidéos, des images, des textes et des éléments audio.
2
Capacités multimodales — Le modèle pourra également générer des images et de l'audio à terme.
3
Cohérence visuelle — L'IA conserve une cohérence visuelle entre plusieurs modifications successives, grâce à sa connaissance du "monde réel".
💡
Pourquoi c'est important : Cette nouvelle technologie pourrait révolutionner la création de contenus visuels et permettre la génération de vidéos explicatives à partir de courtes consignes textuelles.