- Inhalt:
- Allgemeines Modell
- Klassifikation im IR
- Ähnlichkeitssuche
- Vektorraummodell
- Modell
- Gewichtung
- Ähnlichkeiten
- Zwischenergebnis
- Weiterentwicklungen
- Relevance Feedback
- Social Filtering
- Web-Links nutzen
- Assoziative Verfahren
|
Kombinierte Gewichtsformeln |
|
Ein Gewicht wi,j für ein Wort
j
im Dokument
i
wird als
Term Frequnecy x Inverted Document Frequency
berechnet:
wi,j= |
h(i,j) |
|
d(j) |
|
dabei ist
- h(i,j) die Häufigkeit des Worts j im Dokument i und
- d(j) die Dokumenthäufigkeit (Anzahl der Dokumente in denen das Wort
j vorkommt).
|