3.4.1.1:
Vektorraummodell:
Sei T={t1,...,tn} eine endliche Menge von Termen und D={d1,...,dm} eine Menge von Dokumenten. Für jedes Dokument
diD sei zu jedem Term tkT ein
Gewicht wi,kR gegeben. Die Gewichte des Dokuments di lassen sich zu einem Vektor wi=(wi,1,...,wi,n)Rn zusammenfassen. Dieser Vektor beschreibt das Dokument
im Vektorraummodell: er ist seine Repräsentation und wird
Dokumentvektor
genannt.
Auch Anfragen werden durch Vektoren qRn dargestellt. Wie bei der Repräsentation der
Dokumente wird die Anfrage durch eine Menge gewichteter Terme, den
Anfragevektor oder
Queryvektor,
dargestellt.
Schließlich sei eine
Ähnlichkeitsfunktion
s:Rn×Rn->R definiert, mit der jedem Paar aus zwei Vektoren
x,yRn ein reeller Ähnlichkeitswert s(x,y) zugewiesen wird.
© 2000 / HTML-Version 14. 1. 2000: R. Ferber