« UniVideo » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(Une version intermédiaire par un autre utilisateur non affichée)
Ligne 1 : Ligne 1 :
== EN CONSTRUCTION ==
== Définition ==
== Définition ==
Nom propre d'un outil permettant de combiner une requête textuelle grâce à un '''[[grand modèle de langues (GML)]]''' et des images sources afin de '''[[génération automatique d'image|générer un montage vidéo]]''' qui combine ces images selon la requête.  
Nom propre d'un outil permettant de combiner une requête textuelle grâce à un '''[[grand modèle de langues (GML)]]''' et des images sources afin de '''[[génération automatique d'image|générer un montage vidéo]]''' qui combine ces images selon la requête.  
Ligne 24 : Ligne 22 :
[https://congwei1230.github.io/UniVideo/  Source : UniVideo, GitHub.io]
[https://congwei1230.github.io/UniVideo/  Source : UniVideo, GitHub.io]


[[Catégorie:vocabulary]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 30 avril 2026 à 20:19

Définition

Nom propre d'un outil permettant de combiner une requête textuelle grâce à un grand modèle de langues (GML) et des images sources afin de générer un montage vidéo qui combine ces images selon la requête.

Compléments

Le montage de la vidéo utilise une architecture à double flux, et un modèle DiT multimodal (MMDiT) de génération d'image.

Français

UniVideo

Anglais

UniVideo


Sources

Source : arxiv

Source : huggingface

Source : UniVideo, GitHub.io

Contributeurs: Arianne Arel, Claude Coulombe, wiki