« UniVideo » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
Nom propre d'un outil permettant de combiner une requête textuelle grâce à un '''[[grand modèle de langues (GML)]]''' et des images sources afin de ''[[génération automatique d'image|générer un montage vidéo]]''' qui combine ces images selon la requête.  
Nom propre d'un outil permettant de combiner une requête textuelle grâce à un '''[[grand modèle de langues (GML)]]''' et des images sources afin de '''[[génération automatique d'image|générer un montage vidéo]]''' qui combine ces images selon la requête.  


== Compléments ==
== Compléments ==

Version du 28 avril 2026 à 15:04

EN CONSTRUCTION

Définition

Nom propre d'un outil permettant de combiner une requête textuelle grâce à un grand modèle de langues (GML) et des images sources afin de générer un montage vidéo qui combine ces images selon la requête.

Compléments

Le montage de la vidéo utilise une architecture à double flux, et un modèle DiT multimodal (MMDiT) de génération d'image.

Français

UniVideo

Anglais

UniVideo


Sources

Source : arxiv

Source : huggingface

Source : UniVideo, GitHub.io

Contributeurs: Arianne Arel, Claude Coulombe, wiki