Ein Ähnlichkeitsmaß, bei dem die Länge der Vektoren keinen direkten Einfluss auf die
Ähnlichkeit hat, ist das Cosinus-Maß (der Cosinus im
Rn
):
cos |
(wi,q) |
=
|
|
|
wi,kqk |
 |
| ( |
|
wi,k2)1/2 |
( |
|
qk2)1/2 |
|
Wie der Cosinus in der Ebene liegen die Ähnlichkeitswerte
zwischen zwei Vektoren bei diesem Maß immer im Intervall
[-1,1]
. Die beiden Wurzeln im Nenner sind
gerade die euklidischen Längen der Vektoren
wi
und
q
. Man kann sich die Formel also auch als einfaches
Skalarprodukt der normierten Vektoren
wi |
 |
| ( |
|
wi,k2)1/2 |
|
| und |
q |
 |
| ( |
|
qk2)1/2 |
|
und
vorstellen.
Das ist auch der Grund für die Wahl des Maßes:
Die Ähnlichkeitswerte
sind in gewissem Sinne unabhängig von
der euklidischen Länge der Vektoren, also der Anzahl und
Größe der von
0
verschiedenen Einträge in den Vektoren. Sie
hängen lediglich von der "Richtung" der
Vektoren ab, also dem Verhältnis der Vektoreinträge
untereinander. Werden nun zwei Vektoren mit dem
Cosinus-Maß verglichen, ist ihre Ähnlichkeit am
größten, wenn sie die gleiche Richtung haben, sich also nur durch einen
positiven Faktor voneinander unterscheiden.
Die Vektoren mit gleicher
Ähnlichkeit zu einem Referenzvektor sind demnach
die, die denselben Winkel mit dem Referenzvektor bilden.
Im Zweidimensionalen sind das zwei Strahlen, die
symmetrisch zum Referenzvektor von
(0,0)
ausgehen (siehe Abbildung 34
).
|