3.4.1.1:
Vektorraummodell:
Sei T={t1,...,tn} eine endliche Menge von
Termen und D={d1,...,dm} eine Menge von Dokumenten. Für jedes
Dokument di
D sei zu jedem Term tk
T ein
Gewicht wi,k
R gegeben. Die Gewichte des Dokuments di lassen sich zu einem Vektor wi=(wi,1,...,wi,n)
Rn zusammenfassen. Dieser Vektor beschreibt das Dokument
im Vektorraummodell: er ist seine Repräsentation und wird
Dokumentvektor
genannt.
Auch Anfragen werden durch Vektoren q
Rn dargestellt. Wie bei der Repräsentation der
Dokumente wird die Anfrage durch eine Menge gewichteter Terme, den
Anfragevektor oder
Queryvektor,
dargestellt.
Schließlich sei eine
Ähnlichkeitsfunktion
s:Rn×Rn->R definiert, mit der jedem Paar aus zwei Vektoren
x,y
Rn ein reeller Ähnlichkeitswert s(x,y) zugewiesen wird.
© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber