« SAIL-VL2 » : différence entre les versions

Dernière version du 30 avril 2026 à 20:19

Définition

Nom propre d'un modèle fondateur de génération image-à-texte conçu pour une compréhension et un raisonnement multimodaux complets.

Complément

Il atteint des performances de pointe dans divers bancs d'essais grâce au nettoyage des données, à l'entraînement progressif et à l'architecture de mixture d'experts creuse.

Voir aussi entraînement

Français

SAIL-VL2

Anglais

SAIL-VL2

Vision-language foundation model for comprehensive multimodal understanding and reasoning. It achieves state-of-the-art performance across diverse benchmarks through data curation, progressive training, and sparse MoE architecture.

Sources

Source : arxiv

Source : GitHub

Source : huggingface

Version du 28 avril 2026 à 14:43 (voir la source) Claude COULOMBE (discussion \| contributions) Aucun résumé des modifications ← Modification précédente		Dernière version du 30 avril 2026 à 20:19 (voir la source) Pitpitt (discussion \| contributions) Aucun résumé des modifications
Ligne 23 :		Ligne 23 :

	[[Catégorie:GRAND LEXIQUE FRANÇAIS]]		[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

	~~[[Catégorie:Publication]]~~

« SAIL-VL2 » : différence entre les versions