ZURÜCK

3.1.1: Logik des Booleschen Retrieval

Die Grundidee des Booleschen Retrieval ist es, Mengenoperationen auf Mengen von Dokumenten oder Objekten anzuwenden, die durch Attributwerte charakterisiert sind. Ein Attribut ist dabei eine Abbildung, die einem Dokument einen Wert zuordnet. Der Grundbaustein einer Booleschen Anfrage ist ein Paar, das aus einem Attribut und einem dazugehörigen Attributwert ( Attribut-Wert-Paar) besteht und auch elementare Boolesche Anfrage genannt wird. Ein Attribut-Wert-Paar steht für die Menge der Dokumente, bei denen das entsprechende Attribut den angegebenen Wert annimmt, die also die elementare Anfrage erfüllen. Elementare Anfragen können durch die Operatoren AND, OR und NOT verknüpft werden.

Formal lässt sich das so formulieren: Bezeichne D eine Menge von Dokumenten und t:D->T , t(d)=ti ein Attribut, so ist

Dt,ti=t-1({ti})={dD | t(d)= ti}

die Menge der Dokumente, bei denen das Attribut t den Wert ti annimmt, die also durch den Attributwert ti charakterisiert sind. Diese Menge wird als Ergebnismenge der elementaren Anfrage, die nur aus (t,t1) besteht, zurückgeliefert. Sind in einer Anfrage zwei Attribut-Wert-Paare durch einen Booleschen Operator verknüpft, wird damit die entsprechende Verknüpfung der Dokumentmengen bezeichnet: (t,t1) AND (s,s1) bezeichnet den Durchschnitt Dt,t1Ds,s1 , der Ausdruck (t,t1) OR (s,s1) die Vereinigung Dt,t1Ds,s1 und der unäre Operator NOT (t,t1) das Komplement D\Dt,t1 . Letzterer wird i. a. nur in Verbindung mit dem AND Operator eingesetzt, um bestimmte Dokumente aus einer Ergebnismenge auszuschließen. Da bei diesen Operationen wieder Mengen entstehen, können die Operatoren AND, OR und NOT auch auf diese Mengen angewendet werden. Durch geeignete Klammerung können so beliebig tief geschachtelte Ausdrücke gebildet werden, mit denen komplexe Mengen beschrieben werden können.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber