ZURÜCK

4.1.2: Verallgemeinerte Boolesche Verfahren

Dokument- und Anfragevektoren des Vektorraummodells können - wenn die Gewichte nur aus dem Wertebereich [0,1] stammen - als unscharfe Mengen über den Termen des Vokabulars gesehen werden. Ganz ähnlich können die Ähnlichkeitswerte der Dokumente zu einer Anfrage als Werte einer Zugehörigkeitsfunktion über der Menge der Dokumente aufgefasst werden, wenn sie nur aus dem Intervall [0,1] stammen.

Beim Booleschen Retrieval werden Dokumente und Anfragen als Teilmengen des Vokabulars dargestellt. Der Übergang von der Menge der Terme zu Teilmengen der Dokumentmenge wird durch die Bildung der Ergebnismengen für elementare Anfragen vollzogen, die die Dokumente enthalten, bei denen die Schnittmenge von Anfrage und Dokument nicht leer ist. Diese elementaren Ergebnismengen werden dann gemäß der angegebenen Verknüpfungen weiter verarbeitet.

In Analogie zu diesem Vorgehen, kann man einen Anfragevektor in elementare Anfragevektoren zerlegen, die nur an genau einer Stelle einen von Null verschiedenen Eintrag enthalten. Wählt man weiter analog zum Durchschnitt der Termmengen, die beim Booleschen Retrieval die Anfrage und das Dokument repräsentieren, das Minimum der Werte der Zugehörigkeitsfunktionen, erhält man als Ähnlichkeitswert zwischen einer elementaren Anfrage und einem Dokument gerade dieses Minimum der Einträge für den Term, der in der elementaren Anfrage behandelt wird. Dieser Wert kann als Zugehörigkeitswert des Dokuments zur unscharfen elementaren Ergebnismenge benutzt werden. Für jedes Paar aus einer elementaren Anfrage und einem Dokumentvektor erhält man so eine unscharfe elementare Ergebnismenge. Diese unscharfen Mengen können nach den Regeln der unscharfen Mengen weiter verarbeitet werden (siehe z. B. Salton, Fox & Wu 1983 [->]).

ZUGANG4.1.2.1: Das MMM-Modell

ZUGANG4.1.2.2: Das Paice Modell

ZUGANG4.1.2.3: Das P-Norm Modell


ZURÜCK

© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber