Zurück Weiter

Inhalt:
Allgemeines Modell
Klassifikation im IR
Ähnlichkeitssuche
Vektorraummodell
Modell
Gewichtung
Ähnlichkeiten
Zwischenergebnis
Weiterentwicklungen
Relevance Feedback
Social Filtering
Web-Links nutzen
Assoziative Verfahren

Mehr dazu:
Vektorraummodell
Ähnlichkeitsfunktionen

Beispiel Skalarprodukt vs. Cosinusmaß
 

   Das Skalarprodukt

... begünstigt lange Dokumente, wenn nur die Häufigkeit als Gewicht verwendet wird.

Schreibt man den gleichen Text zweimal hintereinander, ergibt sich der doppelte Ähnlichkeitswert.

   Das Cosinusmaß

... ist unabhängig von der Länge der Dokumente. Es berücksichtigt nur das Verhältnis der Gewichte zueinander.

cos (wi,q) =
n
k=1
wi,kqk
(
n
k=1
w2i,k )1/2 (
n
k=1
q2k )1/2

Seine Werte liegen immer im Intervall [-1,1].

Die beiden Wurzeln im Nenner sind die euklidischen Längen der Vektoren, das Maß also das Skalarprodukt der normierten Vektoren.

wi
(
n
k=1
w2i,k )1/2
und
q
(
n
k=1
q2k )1/2

Reginald Ferber, Münster (Westf): Automatische Generierung von Inhaltsrepräsentationen
FH Darmstadt-Dieburg, 2003-07-02, http://information-retrieval.de/ferber/fh-darmstadt/html/index.html
HTML file generated 2. 7. 2003 by R. Ferber