Contributions de Claude COULOMBE

Rechercher des contributionsaffichermasquer

⧼contribs-top⧽

Adresse IP ou nom d’utilisateur :

Espace de noms :

Inverser la sélection

Espace de noms associé

Filtrer les balises :

Ne montrer que les contributions qui sont les dernières des articles

Afficher uniquement les modifications qui sont des créations de page

Masquer les modifications mineures

⧼contribs-date⧽

À partir du :

Jusqu’au :

16:0726 avril 2025 à 16:07 diff hist −2‎ Gradient boosted decision tree ‎ Destination de redirection modifiée de Arbre de décision boosté par le gradient en Arbre de décision à dopage de gradient Balise : Cible de la redirection modifiée
16:0626 avril 2025 à 16:06 diff hist +57‎ N Arbre de décision amplifié par le gradient ‎ Claude COULOMBE a déplacé la page Arbre de décision amplifié par le gradient vers Arbre de décision à dopage de gradient Balise : Nouvelle redirection

02:5525 avril 2025 à 02:55 diff hist −9‎ Théorème du gradient de politique ‎Aucun résumé des modifications
02:5425 avril 2025 à 02:54 diff hist +18‎ Théorème du gradient de politique ‎Aucun résumé des modifications
02:5325 avril 2025 à 02:53 diff hist +818‎ N Théorème du gradient de politique ‎ Page créée avec « ==Définition== En apprentissage par renforcement, le théorème du gradient de politique permet de simplifier l'apprentissage d'une [politique d'action] en établissant que le gradient (ou dérivée) de la récompense attendue en suivant une [politique d'action] est l'espérance du produit de la récompense attendue par le gradient (ou dérivée) du logarithme de la [politique d'action]. La [politique d'action] est généralement exprimée sous la forme d'u... »
02:0225 avril 2025 à 02:02 diff hist 0‎ Politique d'action ‎Aucun résumé des modifications actuelle
01:5925 avril 2025 à 01:59 diff hist −23‎ Politique d'action ‎Aucun résumé des modifications
01:5825 avril 2025 à 01:58 diff hist +305‎ Politique d'action ‎Aucun résumé des modifications
01:5225 avril 2025 à 01:52 diff hist +148‎ Politique d'action ‎Aucun résumé des modifications
01:4525 avril 2025 à 01:45 diff hist +197‎ Méthode du gradient de politique ‎Aucun résumé des modifications
01:1225 avril 2025 à 01:12 diff hist 0‎ Policy gradient ‎ Destination de redirection modifiée de Méthode à gradient de politique en Méthode du gradient de politique actuelle Balise : Cible de la redirection modifiée
01:0925 avril 2025 à 01:09 diff hist +50‎ N Méthode à gradient de politique ‎ Claude COULOMBE a déplacé la page Méthode à gradient de politique vers Méthode du gradient de politique actuelle Balise : Nouvelle redirection
01:0925 avril 2025 à 01:09 diff hist 0‎ m Méthode du gradient de politique ‎ Claude COULOMBE a déplacé la page Méthode à gradient de politique vers Méthode du gradient de politique
01:0925 avril 2025 à 01:09 diff hist +201‎ Méthode du gradient de politique ‎Aucun résumé des modifications
01:0925 avril 2025 à 01:09 diff hist +73‎ N Policy gradient algorithm ‎ Page redirigée vers Méthode du gradient de politique actuelle Balise : Nouvelle redirection
01:0825 avril 2025 à 01:08 diff hist +73‎ N Policy gradient method ‎ Page redirigée vers Méthode du gradient de politique actuelle Balise : Nouvelle redirection
00:5325 avril 2025 à 00:53 diff hist −2‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:5225 avril 2025 à 00:52 diff hist +107‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:2125 avril 2025 à 00:21 diff hist −119‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:2125 avril 2025 à 00:21 diff hist −4‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:2025 avril 2025 à 00:20 diff hist +82‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:1925 avril 2025 à 00:19 diff hist +16‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:1925 avril 2025 à 00:19 diff hist −99‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:0525 avril 2025 à 00:05 diff hist +120‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:0525 avril 2025 à 00:05 diff hist 0‎ Méthode du gradient de politique ‎Aucun résumé des modifications
00:0325 avril 2025 à 00:03 diff hist −35‎ Apprentissage par fonction Q ‎Aucun résumé des modifications
00:0325 avril 2025 à 00:03 diff hist −16‎ Politique d'action ‎Aucun résumé des modifications
00:0225 avril 2025 à 00:02 diff hist +13‎ Politique d'action ‎Aucun résumé des modifications
00:0225 avril 2025 à 00:02 diff hist −2‎ Politique d'action ‎Aucun résumé des modifications Balise : Révocation manuelle
00:0125 avril 2025 à 00:01 diff hist +2‎ Politique d'action ‎Aucun résumé des modifications Balise : Révoqué
00:0025 avril 2025 à 00:00 diff hist −18‎ Politique d'action ‎Aucun résumé des modifications

23:5824 avril 2025 à 23:58 diff hist +58‎ N Action policy ‎ Page redirigée vers Politique d'action actuelle Balise : Nouvelle redirection
23:5624 avril 2025 à 23:56 diff hist +29‎ Politique d'action ‎Aucun résumé des modifications
23:5524 avril 2025 à 23:55 diff hist +10‎ Apprentissage par fonction Q ‎Aucun résumé des modifications
23:5424 avril 2025 à 23:54 diff hist +140‎ Méthode du gradient de politique ‎Aucun résumé des modifications
23:4724 avril 2025 à 23:47 diff hist +50‎ N Policy gradient ‎ Claude COULOMBE a déplacé la page Policy gradient vers Méthode à gradient de politique Balise : Nouvelle redirection
23:4724 avril 2025 à 23:47 diff hist 0‎ m Méthode du gradient de politique ‎ Claude COULOMBE a déplacé la page Policy gradient vers Méthode à gradient de politique
23:4724 avril 2025 à 23:47 diff hist +781‎ N Méthode du gradient de politique ‎ Page créée avec « ==Définition== En apprentissage par renforcement la méthode à gradient de politique permet de prévoir la meilleure action à accomplir par un agent dans un état donné de l'environnement. == Compléments == Alors que l’apprentissage par fonction Q vise à prévoir la valeur de la récompense ou la punition d’une action entreprise par un agent dans un certain état, la méthode à gradient de politique prédit directement l’action elle-même.... »
23:4124 avril 2025 à 23:41 diff hist +21‎ Apprentissage par fonction Q ‎Aucun résumé des modifications
23:2224 avril 2025 à 23:22 diff hist 0‎ Apprentissage par renforcement ‎Aucun résumé des modifications

13:3722 avril 2025 à 13:37 diff hist +18‎ Forêt d'isolation ‎Aucun résumé des modifications
13:3222 avril 2025 à 13:32 diff hist −2‎ Outliers ‎ Destination de redirection modifiée de Données aberrantes en Donnée aberrante actuelle Balise : Cible de la redirection modifiée
13:3122 avril 2025 à 13:31 diff hist +8‎ Outliers ‎ Destination de redirection modifiée de Anomalies en Données aberrantes Balise : Cible de la redirection modifiée

18:3014 avril 2025 à 18:30 diff hist −1‎ Représentation sémantique distributionnelle compacte ‎Aucun résumé des modifications
17:4414 avril 2025 à 17:44 diff hist +31‎ Réseau récurrent à longue mémoire court terme ‎Aucun résumé des modifications
17:4014 avril 2025 à 17:40 diff hist −1‎ Réseau récurrent à longue mémoire court terme ‎Aucun résumé des modifications
17:4014 avril 2025 à 17:40 diff hist +288‎ Réseau récurrent à longue mémoire court terme ‎Aucun résumé des modifications
17:3014 avril 2025 à 17:30 diff hist +6‎ Réseau récurrent à longue mémoire court terme ‎Aucun résumé des modifications
17:2914 avril 2025 à 17:29 diff hist +4‎ Réseau récurrent à longue mémoire court terme ‎Aucun résumé des modifications
17:2714 avril 2025 à 17:27 diff hist −33‎ Réseau récurrent à longue mémoire court terme ‎Aucun résumé des modifications

Contributions de Claude COULOMBE

26 avril 2025

25 avril 2025

24 avril 2025

22 avril 2025

14 avril 2025