ZURÜCK

5.3.3: Abduktive Anfrageoptimierung

Aus dem Ansatz Information Retrieval als eine Form des logischen Schließens zu verstehen können noch weitere Vorgehensweisen abgeleitet werden: Im Abschnitt _4.1.1_ waren als verschiedene Formen des Lernens deduktives, induktives und abduktives Lernen eingeführt worden. Abduktives Lernen war als Hypothesenbildung über mögliche Ursachen beschrieben worden.

Die unscharfen Anfragen der Nutzenden eines Information Retrieval Systems können oft auf verschiedene Weisen in exakt formulierte Anfragen übersetzt bzw. als exakte Anfragen interpretiert werden. Insbesondere bei strukturierten Dokumenten besteht die Chance, Wissen oder Fakten zu extrahieren und Anfragen auf diese Fakten zu beziehen. In diesen Fällen kann eine solche Interpretation notwendig und nützlich sein. Hier können abduktive Verfahren eingesetzt werden, um verschiedene Interpretationen einer Anfrage zu generieren und Nutzenden zur Auswahl anzubieten. In einem Dialog über die möglichen Interpretationen können Anfragen präzisiert werden.

Als Modellansatz wird angenommen, daß bei Nutzenden ein Informationsbedarf besteht, als dessen Folge eine Anfrage formuliert wird. Diese Sicht kann parallel zu der oben beschriebenen Annahme gesehen werden, dass ein Dokument dann zu einer Anfrage gehört, wenn die Anfrage aus dem Dokument abgeleitet werden kann: Bei der Formulierung einer Anfrage leiten die Nutzenden eine spezielle Aussage aus einem umfassenderen Informationsbedarf her. Sie sollte daher eine Teilaussage des umfassenderen Informationsbedarfs sein. In dieser Sicht erfüllt die Anfrage eine doppelte Rolle: sie ist sowohl Folgerung aus dem Informtionsbedarf als auch aus dem Dokument. Dadurch stellt sie die Verbindung zwischen den beiden her.

Die abduktive Anfrageentwicklung schließt von der Folge - nämlich der eingegebenen Anfrage - auf die möglichen Ursachen - nämlich den Informationsbedarf. (Dabei übersetzt sie gleichzeitig den Informationsbedarf der Nutzenden in die interne Repräsentation der Dokumente.)

Müller und Thiel (1994 [->]) beschreiben das abduktive System MIRACLE, das z. B. auf einer Sammlung von Biographien von Künstlern, die in einer SGML-ähnlichen Notation vorliegen, arbeitet. Aus den Texten der Biographien können mit Hilfe der Notation Attribute extrahiert werden, wie z. B. Geburtsort und - datum, Sterbeort und - datum eines Künstlers.

Eine Anfrage nach "Pariser Künstlern der Jahrhundertwende" z. B. lässt eine ganze Reihe von möglichen Interpretationen, d. h. Rückschlüssen auf den tatsächlichen Informationsbedarf der oder des Anfragenden zu. Z. B kann ein "Pariser Künstler" ein Künstler sein, der in Paris geboren ist, einer, der in Paris gelebt hat, oder einer, dessen Werke vor allem in Paris zu finden sind. Die Zeitangabe "Jahrhundertwende" muß auch interpretiert werden. Während es noch naheliegt, einen Zeitraum vom Ende des 19. Jahrhunderts bis zum Anfang des 20. Jahrhunderts anzunehmen, wird es schon erheblich unklarer, wie lang der Zeitraum anzusetzen ist.

Eine mögliche Interpretation der Anfrage wäre auch die, dass Künstler gesucht werden, die gerade zu dieser Zeit in Paris waren, während sie sonst eventuell eher anderen Orten zugeordnet werden, dass also die Zeitangabe als eine Modifikation der Ortsangabe gemeint war.

Um diese Interpretationen zu leisten, muß das IR System über eine Regelbasis verfügen, die die Domäne der Dokumente beschreibt. So sollte in einer solchen Basis z. B. stehen, dass eine Person, die ein Künstler oder eine Künstlerin ist, ein Geburtsdatum hat, dass sie entweder einen Todestag hat oder noch lebt, und dass der Todestag zeitlich nach dem Geburtstag liegt. Es kann aber natürlich auch vorkommen, dass ein Geburtstag nicht (genau) bekannt ist, oder dass zwei Daten in verschiedenen Zeitrechnungen angegeben sind. Auch solche Fälle müssen durch die Regeln der Regelbasis abgedeckt werden. Mit den Regeln dieser Basis werden die Anfragen interpretiert. Die Konstruktion einer solchen Regelbasis ist entsprechend aufwändig. Für neue Themengebiete müssen jeweils die gebietsspezifischen Regeln neu entwickelt werden.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber