3.1.1: Logik des Booleschen Retrieval
Die
Grundidee des
Booleschen Retrieval ist es,
Mengenoperationen auf Mengen von Dokumenten oder Objekten
anzuwenden, die durch Attributwerte
charakterisiert sind. Ein
Attribut
ist dabei eine Abbildung, die einem Dokument einen Wert
zuordnet. Der Grundbaustein einer Booleschen
Anfrage ist
ein Paar, das aus einem Attribut und einem dazugehörigen
Attributwert
(
Attribut-Wert-Paar) besteht
und auch
elementare Boolesche
Anfrage genannt wird. Ein
Attribut-Wert-Paar steht für die Menge der Dokumente, bei denen das
entsprechende Attribut den angegebenen Wert annimmt, die also die
elementare Anfrage erfüllen. Elementare Anfragen können durch
die Operatoren AND, OR und NOT verknüpft werden.
Formal lässt sich das so formulieren:
Bezeichne D eine Menge von Dokumenten und
t:D->T , t(d)=ti ein Attribut, so ist
Dt,ti=t-1({ti})={d
D | t(d)= ti}
die Menge der Dokumente, bei denen das Attribut
t den Wert ti annimmt, die also durch den Attributwert
ti charakterisiert sind.
Diese Menge wird als Ergebnismenge der elementaren
Anfrage, die nur aus (t,t1) besteht, zurückgeliefert.
Sind in einer Anfrage zwei
Attribut-Wert-Paare durch einen Booleschen
Operator verknüpft, wird damit die
entsprechende Verknüpfung der Dokumentmengen
bezeichnet: (t,t1) AND (s,s1) bezeichnet den
Durchschnitt Dt,t1
Ds,s1 , der Ausdruck
(t,t1) OR (s,s1) die Vereinigung
Dt,t1
Ds,s1 und der unäre Operator
NOT (t,t1) das Komplement
D\Dt,t1 . Letzterer wird i. a. nur in Verbindung
mit dem AND Operator eingesetzt, um bestimmte Dokumente aus einer
Ergebnismenge auszuschließen.
Da bei diesen Operationen wieder Mengen entstehen,
können die Operatoren AND, OR und NOT auch auf diese Mengen
angewendet werden. Durch geeignete Klammerung
können so beliebig tief geschachtelte
Ausdrücke gebildet werden, mit denen komplexe Mengen beschrieben
werden können.
© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber