OmniVideoBench


Révision datée du 7 mars 2026 à 19:11 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Test de performances pour évaluer le raisonnement audiovisuel profond dans une grande variété de tâches et de modalités au sein d'un grand modèle de langues multimodal.

Français

OmniVideoBench

Anglais

OmniVideoBench

Comprehensive benchmark for evaluating deep audio-visual reasoning across a wide variety of tasks and modalities in multimodal large language model.

Sources

Source : GitHub

Source : huggingface

Source : OmniVideoBench

Contributeurs: Arianne Arel, wiki