Zurück Weiter

Inhalt:
Allgemeines Modell
Klassifikation im IR
Ähnlichkeitssuche
Vektorraummodell
Modell
Gewichtung
Ähnlichkeiten
Zwischenergebnis
Weiterentwicklungen
Relevance Feedback
Social Filtering
Web-Links nutzen
Assoziative Verfahren

Mehr dazu:
Vektorraummodell
Gewichtungsmethoden

Kombinierte Gewichtsformeln
 

   TF - IDF - Formel

Ein Gewicht wi,j für ein Wort j im Dokument i wird als Term Frequnecy x Inverted Document Frequency berechnet:
wi,j=
h(i,j)
d(j)
dabei ist

  • h(i,j) die Häufigkeit des Worts j im Dokument i und
  • d(j) die Dokumenthäufigkeit (Anzahl der Dokumente in denen das Wort j vorkommt).
Reginald Ferber, Münster (Westf): Automatische Generierung von Inhaltsrepräsentationen
FH Darmstadt-Dieburg, 2003-07-02, http://information-retrieval.de/ferber/fh-darmstadt/html/index.html
HTML file generated 2. 7. 2003 by R. Ferber