Fréquence du terme - fréquence inverse du document


Définition

Méthode de pondération qui donne les poids les plus élevés aux termes qui apparaissent les plus fréquemment dans un document, par rapport aux autres documents d'un corpus.

Le poids augmente proportionnellement au nombre d'occurrences du terme dans le document, c'est-à-dire la fréquence du terme (TF), et ce, en fonction de la fréquence du terme dans le corpus, c'est-à-dire la fréquence inverse du document (IDF).

Français

pondération TF-IDF

mesure TF-IDF

TF-IDF

fréquence du terme - fréquence inverse du document

Anglais

TF-IDF

Term Frequency - Inverse Document Frequency


Sources

Contributeurs: Jean Benoît Morel, wiki