4.1.2.3: Das P-Norm Modell
Schließlich beschreiben Fox, Betrabet, Koushik
und Lee [->] noch
das P-Norm Modell. Hier sind
auch im Anfragevektor
Einträge zwischen Null und Eins zugelassen.
Als Ähnlichkeitsmaß
für eine OR-Anfrage wird die Formel

mit p
{1,...,∞} verwendet.
Für p=1 und Anfragevektoren, die nur aus Nullen und
Einsen bestehen, handelt es sich also um die
gleiche Formel (
_4.1.2.2_
) wie bei
der Paice Ähnlichkeit mit c=1 . Für größere Werte von p beschreibt der
Zähler die P-Norm
Länge der Projektion des Dokumentvektors auf den Unterraum, der von
den Anfragetermen aufgespannt wird, für p=2 also die euklidische Länge dieses Vektors.
Dieser Wert wird mit der p-Norm Länge des
Anfragevektors normiert. Falls im Anfragevektor auch Werte
zwischen Null und Eins zugelassen sind, wird der Unterraum entsprechend
afin abgebildet, d. h. die Skalen seiner Achsen werden
verändert.
Fox, Betrabet, Koushik und Lee [->] geben als
Heuristik für die Wahl des Maßes
den Abstand zum Ursprung des Unterraumes an.
Als Ähnlichkeitsmaß für eine AND Anfrage
wählen sie die Formel

mit p
{1,...,∞} , und interpretieren diesen Wert als Abstand der
Projektion des Dokumentvektors vom Punkt (1,...,1) im Unterraum der von den Termen der
Anfrage aufgespannt wird. Das angegebene Maß ist aber nur eine Näherung
für diesen Abstand.
© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber