Contributions de Claude COULOMBE
26 avril 2025
- 16:0726 avril 2025 à 16:07 diff hist −2 Gradient boosted decision tree Destination de redirection modifiée de Arbre de décision boosté par le gradient en Arbre de décision à dopage de gradient Balise : Cible de la redirection modifiée
- 16:0626 avril 2025 à 16:06 diff hist +57 N Arbre de décision amplifié par le gradient Claude COULOMBE a déplacé la page Arbre de décision amplifié par le gradient vers Arbre de décision à dopage de gradient Balise : Nouvelle redirection
25 avril 2025
- 02:5525 avril 2025 à 02:55 diff hist −9 Théorème du gradient de politique Aucun résumé des modifications
- 02:5425 avril 2025 à 02:54 diff hist +18 Théorème du gradient de politique Aucun résumé des modifications
- 02:5325 avril 2025 à 02:53 diff hist +818 N Théorème du gradient de politique Page créée avec « ==Définition== En apprentissage par renforcement, le théorème du gradient de politique permet de simplifier l'apprentissage d'une [politique d'action] en établissant que le gradient (ou dérivée) de la récompense attendue en suivant une [politique d'action] est l'espérance du produit de la récompense attendue par le gradient (ou dérivée) du logarithme de la [politique d'action]. La [politique d'action] est généralement exprimée sous la forme d'u... »
- 02:0225 avril 2025 à 02:02 diff hist 0 Politique d'action Aucun résumé des modifications actuelle
- 01:5925 avril 2025 à 01:59 diff hist −23 Politique d'action Aucun résumé des modifications
- 01:5825 avril 2025 à 01:58 diff hist +305 Politique d'action Aucun résumé des modifications
- 01:5225 avril 2025 à 01:52 diff hist +148 Politique d'action Aucun résumé des modifications
- 01:4525 avril 2025 à 01:45 diff hist +197 Méthode du gradient de politique Aucun résumé des modifications
- 01:1225 avril 2025 à 01:12 diff hist 0 Policy gradient Destination de redirection modifiée de Méthode à gradient de politique en Méthode du gradient de politique actuelle Balise : Cible de la redirection modifiée
- 01:0925 avril 2025 à 01:09 diff hist +50 N Méthode à gradient de politique Claude COULOMBE a déplacé la page Méthode à gradient de politique vers Méthode du gradient de politique actuelle Balise : Nouvelle redirection
- 01:0925 avril 2025 à 01:09 diff hist 0 m Méthode du gradient de politique Claude COULOMBE a déplacé la page Méthode à gradient de politique vers Méthode du gradient de politique
- 01:0925 avril 2025 à 01:09 diff hist +201 Méthode du gradient de politique Aucun résumé des modifications
- 01:0925 avril 2025 à 01:09 diff hist +73 N Policy gradient algorithm Page redirigée vers Méthode du gradient de politique actuelle Balise : Nouvelle redirection
- 01:0825 avril 2025 à 01:08 diff hist +73 N Policy gradient method Page redirigée vers Méthode du gradient de politique actuelle Balise : Nouvelle redirection
- 00:5325 avril 2025 à 00:53 diff hist −2 Méthode du gradient de politique Aucun résumé des modifications
- 00:5225 avril 2025 à 00:52 diff hist +107 Méthode du gradient de politique Aucun résumé des modifications
- 00:2125 avril 2025 à 00:21 diff hist −119 Méthode du gradient de politique Aucun résumé des modifications
- 00:2125 avril 2025 à 00:21 diff hist −4 Méthode du gradient de politique Aucun résumé des modifications
- 00:2025 avril 2025 à 00:20 diff hist +82 Méthode du gradient de politique Aucun résumé des modifications
- 00:1925 avril 2025 à 00:19 diff hist +16 Méthode du gradient de politique Aucun résumé des modifications
- 00:1925 avril 2025 à 00:19 diff hist −99 Méthode du gradient de politique Aucun résumé des modifications
- 00:0525 avril 2025 à 00:05 diff hist +120 Méthode du gradient de politique Aucun résumé des modifications
- 00:0525 avril 2025 à 00:05 diff hist 0 Méthode du gradient de politique Aucun résumé des modifications
- 00:0325 avril 2025 à 00:03 diff hist −35 Apprentissage par fonction Q Aucun résumé des modifications
- 00:0325 avril 2025 à 00:03 diff hist −16 Politique d'action Aucun résumé des modifications
- 00:0225 avril 2025 à 00:02 diff hist +13 Politique d'action Aucun résumé des modifications
- 00:0225 avril 2025 à 00:02 diff hist −2 Politique d'action Aucun résumé des modifications Balise : Révocation manuelle
- 00:0125 avril 2025 à 00:01 diff hist +2 Politique d'action Aucun résumé des modifications Balise : Révoqué
- 00:0025 avril 2025 à 00:00 diff hist −18 Politique d'action Aucun résumé des modifications
24 avril 2025
- 23:5824 avril 2025 à 23:58 diff hist +58 N Action policy Page redirigée vers Politique d'action actuelle Balise : Nouvelle redirection
- 23:5624 avril 2025 à 23:56 diff hist +29 Politique d'action Aucun résumé des modifications
- 23:5524 avril 2025 à 23:55 diff hist +10 Apprentissage par fonction Q Aucun résumé des modifications
- 23:5424 avril 2025 à 23:54 diff hist +140 Méthode du gradient de politique Aucun résumé des modifications
- 23:4724 avril 2025 à 23:47 diff hist +50 N Policy gradient Claude COULOMBE a déplacé la page Policy gradient vers Méthode à gradient de politique Balise : Nouvelle redirection
- 23:4724 avril 2025 à 23:47 diff hist 0 m Méthode du gradient de politique Claude COULOMBE a déplacé la page Policy gradient vers Méthode à gradient de politique
- 23:4724 avril 2025 à 23:47 diff hist +781 N Méthode du gradient de politique Page créée avec « ==Définition== En apprentissage par renforcement la méthode à gradient de politique permet de prévoir la meilleure action à accomplir par un agent dans un état donné de l'environnement. == Compléments == Alors que l’apprentissage par fonction Q vise à prévoir la valeur de la récompense ou la punition d’une action entreprise par un agent dans un certain état, la méthode à gradient de politique prédit directement l’action elle-même.... »
- 23:4124 avril 2025 à 23:41 diff hist +21 Apprentissage par fonction Q Aucun résumé des modifications
- 23:2224 avril 2025 à 23:22 diff hist 0 Apprentissage par renforcement Aucun résumé des modifications
22 avril 2025
- 13:3722 avril 2025 à 13:37 diff hist +18 Forêt d'isolation Aucun résumé des modifications
- 13:3222 avril 2025 à 13:32 diff hist −2 Outliers Destination de redirection modifiée de Données aberrantes en Donnée aberrante actuelle Balise : Cible de la redirection modifiée
- 13:3122 avril 2025 à 13:31 diff hist +8 Outliers Destination de redirection modifiée de Anomalies en Données aberrantes Balise : Cible de la redirection modifiée
14 avril 2025
- 18:3014 avril 2025 à 18:30 diff hist −1 Représentation sémantique distributionnelle compacte Aucun résumé des modifications
- 17:4414 avril 2025 à 17:44 diff hist +31 Réseau récurrent à longue mémoire court terme Aucun résumé des modifications
- 17:4014 avril 2025 à 17:40 diff hist −1 Réseau récurrent à longue mémoire court terme Aucun résumé des modifications
- 17:4014 avril 2025 à 17:40 diff hist +288 Réseau récurrent à longue mémoire court terme Aucun résumé des modifications
- 17:3014 avril 2025 à 17:30 diff hist +6 Réseau récurrent à longue mémoire court terme Aucun résumé des modifications
- 17:2914 avril 2025 à 17:29 diff hist +4 Réseau récurrent à longue mémoire court terme Aucun résumé des modifications
- 17:2714 avril 2025 à 17:27 diff hist −33 Réseau récurrent à longue mémoire court terme Aucun résumé des modifications





