Role-conditioned Advantage Estimation
en construction
Définition
Méthode d'apprentissage par renforcement qui stabilise l'entraînement multiagent en calculant des fonctions d'avantages conditionnées par les rôles des agents, le contexte ou autres variables conditionnelles associées. Elle améliore les scores de raisonnement et la stabilité du gradient.
Voir aussi agent
Français
xxxxxxx
Anglais
Role-conditioned Advantage Estimation
RAE
Reinforcement learning method that stabilizes multi-agent training by computing advantages functions conditioned on agent roles, context, or related conditional variables. It improves reasoning scores and gradient stability.
Sources
Contributeurs: Arianne Arel





