ZURÜCK

3.4.1.1: Vektorraummodell:

Sei T={t1,...,tn} eine endliche Menge von Termen und D={d1,...,dm} eine Menge von Dokumenten. Für jedes Dokument diD sei zu jedem Term tkT ein Gewicht wi,kR gegeben. Die Gewichte des Dokuments di lassen sich zu einem Vektor wi=(wi,1,...,wi,n)Rn zusammenfassen. Dieser Vektor beschreibt das Dokument im Vektorraummodell: er ist seine Repräsentation und wird Dokumentvektor genannt.
Auch Anfragen werden durch Vektoren qRn dargestellt. Wie bei der Repräsentation der Dokumente wird die Anfrage durch eine Menge gewichteter Terme, den Anfragevektor oder Queryvektor, dargestellt.
Schließlich sei eine Ähnlichkeitsfunktion s:Rn×Rn->R definiert, mit der jedem Paar aus zwei Vektoren x,yRn ein reeller Ähnlichkeitswert s(x,y) zugewiesen wird.

ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber