3.1.1: Logik des Booleschen Retrieval
Die Grundidee des Booleschen Retrieval ist es, Mengenoperationen
auf Mengen von Dokumenten oder Objekten anzuwenden, die durch
Attributwerte charakterisiert sind. Ein
Attribut ist dabei eine
Abbildung, die einem Dokument einen Wert zuordnet. Der Grundbaustein
einer Booleschen Anfrage ist ein Paar, das aus einem Attribut und einem
dazugehörigen Attributwert
(
Attribut-Wert-Paar) besteht
und auch
elementare Boolesche
Anfrage genannt wird. Ein Attribut-Wert-Paar
steht für die Menge der Dokumente, bei denen das entsprechende
Attribut den angegebenen Wert annimmt, die also die elementare Anfrage
erfüllen. Elementare Anfragen können durch die Operatoren AND,
OR und NOT verknüpft werden.
Formal lässt sich das so formulieren: Bezeichne
D eine Menge von Dokumenten und t:D->T , t(d)=ti ein Attribut, so ist
Dt,ti=t-1({ti})={dD | t(d)= ti}
die Menge der Dokumente, bei denen das Attribut t den Wert ti annimmt, die also durch den Attributwert
ti charakterisiert sind. Diese Menge wird als
Ergebnismenge der elementaren Anfrage, die nur aus (t,t1) besteht, zurückgeliefert. Sind in einer Anfrage
zwei Attribut-Wert-Paare durch einen Booleschen Operator verknüpft,
wird damit die entsprechende Verknüpfung der Dokumentmengen
bezeichnet: (t,t1) AND (s,s1) bezeichnet den Durchschnitt Dt,t1Ds,s1 , der Ausdruck (t,t1) OR (s,s1) die Vereinigung Dt,t1Ds,s1 und der unäre Operator NOT (t,t1) das Komplement D\Dt,t1 . Letzterer wird i. a. nur in Verbindung mit dem AND
Operator eingesetzt, um bestimmte Dokumente aus einer Ergebnismenge
auszuschließen. Da bei diesen Operationen wieder Mengen entstehen,
können die Operatoren AND, OR und NOT auch auf diese Mengen
angewendet werden. Durch geeignete Klammerung können so beliebig
tief geschachtelte Ausdrücke gebildet werden, mit denen komplexe
Mengen beschrieben werden können.
© 2000 / HTML-Version 14. 1. 2000: R. Ferber