ZURÜCK

5.1.1.3: Das P-Norm Modell

Schließlich beschreiben Fox, Betrabet, Koushik und Lee [->] noch das P-Norm Modell. Hier sind auch im Anfragevektor Einträge zwischen Null und Eins zugelassen. Als Ähnlichkeitsmaß für eine OR-Anfrage wird die Formel

mit p{1,...,∞} verwendet. Für p=1 und Anfragevektoren, die nur aus Nullen und Einsen bestehen, handelt es sich also um die gleiche Formel ( _5.1.1.2_ ) wie bei der Paice Ähnlichkeit mit c=1 . Für größere Werte von p beschreibt der Zähler die P-Norm Länge der Projektion des Dokumentvektors auf den Unterraum, der von den Anfragetermen aufgespannt wird, für p=2 also die euklidische Länge dieses Vektors. Dieser Wert wird mit der p-Norm Länge des Anfragevektors normiert. Falls im Anfragevektor auch Werte zwischen Null und Eins zugelassen sind, wird der Unterraum entsprechend afin abgebildet, d. h. die Skalen seiner Achsen werden verändert.

Fox, Betrabet, Koushik und Lee [->] geben als Heuristik für die Wahl des Maßes den Abstand zum Ursprung des Unterraumes an. Als Ähnlichkeitsmaß für eine AND Anfrage wählen sie die Formel

mit p{1,...,∞} , und interpretieren diesen Wert als Abstand der Projektion des Dokumentvektors vom Punkt (1,...,1) im Unterraum der von den Termen der Anfrage aufgespannt wird. Das angegebene Maß ist aber nur eine Näherung für diesen Abstand.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber