ZURÜCK

3.4.5.1: Das Skalarprodukt

Das Skalarprodukt ist linear: wird einer der beiden Vektoren mit einem Faktor multipliziert, wird auch der Ähnlichkeitswert mit diesem Faktor multipliziert; kann ein Vektor als Summe zweier Vektoren dargestellt werden, ist der Ähnlickeitswert gleich der Summe der Skalarprodukte der einzelnen Vektoren mit dem Anfragevektor.

Beim Skalarprodukt liegen die Vektoren gleicher Ähnlichkeit auf einer Hyperebene, die parallel zu derjenigen ist, die senkrecht auf dem Vektor steht. Im zweidimensionalen Fall ist das eine Gerade, die senkrecht (rechtwinklig) zu dem Vektor ist. Das lässt sich folgendermaßen einsehen:

Sei (a,b) der Referenzvektor, zu dem der Vektor (x,y) die Ähnlichkeit c habe; dann gilt

ax+by=c

und folglich

Da die Steigung des Vektors (a,b) gerade (b)/(a) ist, bildet diese Gerade mit dem Referenzvektor einen rechten Winkel. Für verschiedene Werte von c ergeben sich parallele Geraden.

Wegen der Linearität des Skalarprodukt wirkt sich ein Faktor auf einen der Vektoren als Faktor auf die Ähnlichkeit aus (daher die parallelen Hyperebenen). Die Ähnlichkeit, die ein Vektor zu sich selbst hat, ist deshalb gerade das Quadrat seiner euklidischen Länge. Das heißt in einem Information Retrieval System, das mit dem Vektorraummodell und dem Skalarprodukt als Ähnlichkeitsmaß arbeitet, dass die euklidische Länge der Dokumentvektoren, wie oben beschrieben, einen starken Einfluß auf die Ähnlichkeitswerte beim Vergleich mit einem Anfragevektor hat. Um dies auszugleichen, kann man Maße verwenden, die das vermeiden.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber