« UniVideo » : différence entre les versions

Dernière version du 30 avril 2026 à 20:19

Nom propre d'un outil permettant de combiner une requête textuelle grâce à un grand modèle de langues (GML) et des images sources afin de générer un montage vidéo qui combine ces images selon la requête.

Le montage de la vidéo utilise une architecture à double flux, et un modèle DiT multimodal (MMDiT) de génération d'image.

UniVideo

UniVideo

@@ Ligne 1 : / Ligne 1 : @@
-== EN CONSTRUCTION ==
 == Définition ==
 Nom propre d'un outil permettant de combiner une requête textuelle grâce à un '''[[grand modèle de langues (GML)]]''' et des images sources afin de '''[[génération automatique d'image|générer un montage vidéo]]''' qui combine ces images selon la requête.
@@ Ligne 24 : / Ligne 22 : @@
 [https://congwei1230.github.io/UniVideo/   Source : UniVideo, GitHub.io]
-[[Catégorie:vocabulary]]
+[[Catégorie:GRAND LEXIQUE FRANÇAIS]]