Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Erweiterte Retrieval-Ansätze -> Logikbasierte Modelle des Information Retrieval
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

3.3.3: Abduktive Anfrageoptimierung

Aus dem Ansatz, Information Retrieval als eine Form des logischen Schließens zu verstehen, können noch weitere Vorgehensweisen abgeleitet werden: In Abschnitt 2.2.1 waren als verschiedene Formen des Lernens deduktives, induktives und abduktives Lernen eingeführt worden. Abduktives Lernen war als Hypothesenbildung über mögliche Ursachen beschrieben worden.

Die unscharfen Anfragen der Nutzenden eines Information-Retrieval-Systems können oft auf verschiedene Weisen in exakt formulierte Anfragen übersetzt bzw. als exakte Anfragen interpretiert werden. Insbesondere bei strukturierten Dokumenten besteht die Chance, Wissen oder Fakten zu extrahieren und Anfragen auf diese Fakten zu beziehen. In diesen Fällen kann eine solche Interpretation notwendig und nützlich sein. Hier können abduktive Verfahren eingesetzt werden, um verschiedene Interpretationen einer Anfrage zu generieren und Nutzenden zur Auswahl anzubieten. In einem Dialog über die möglichen Interpretationen können Anfragen präzisiert werden.

Als Modellansatz wird angenommen, dass bei Nutzenden ein Informationsbedarf besteht, als dessen Folge eine Anfrage formuliert wird. Diese Sicht kann parallel zu der oben beschriebenen Annahme gesehen werden, dass ein Dokument dann zu einer Anfrage gehört, wenn die Anfrage aus dem Dokument abgeleitet werden kann: Bei der Formulierung einer Anfrage leiten die Nutzenden eine spezielle Aussage aus einem umfassenderen Informationsbedarf her. Sie sollte daher eine Teilaussage des umfassenderen Informationsbedarfs sein. In dieser Sicht erfüllt die Anfrage eine doppelte Rolle: Sie ist sowohl Folgerung aus dem Informationsbedarf als auch aus dem Dokument. Dadurch stellt sie die Verbindung zwischen den beiden her.

Die abduktive Anfrageentwicklung schließt von der Folge - nämlich der eingegebenen Anfrage - auf die möglichen Ursachen - nämlich den Informationsbedarf. (Dabei übersetzt sie gleichzeitig den Informationsbedarf der Nutzenden in die interne Repräsentation des Systems.) Müller und Thiel (1994) [->] beschreiben das abduktive System MIRACLE, das auf einer Sammlung von Künstlerbiografien arbeitet, die in einer SGML-ähnlichen Notation vorliegen. Aus den Texten der Biografien können mit Hilfe der Notation Attribute extrahiert werden, z.B. Geburtsort und -datum, Sterbeort und -datum eines Künstlers.

Eine Anfrage wie "Pariser Künstler der Jahrhundertwende" lässt eine ganze Reihe von Interpretationen - also Rückschlüssen auf den tatsächlichen Informationsbedarf der oder des Anfragenden - zu. Mit "Pariser Künstler" kann ein Künstler gemeint sein, der in Paris geboren ist, einer, der in Paris gelebt hat, oder einer, dessen Werke vor allem in Paris zu finden sind. Auch die Zeitangabe "Jahrhundertwende" muss interpretiert werden. War es vor kurzem noch nahe liegend, einen Zeitraum vom Ende des 19. Jahrhunderts bis zum Anfang des 20. Jahrhunderts anzunehmen, ist das nach dem Jahr 2001 nicht mehr so eindeutig. Und auch die Frage, wie lang der Zeitraum anzusetzen ist, muss beantwortet werden.

Eine mögliche Interpretation der Anfrage wäre auch die, dass Künstler gesucht werden, die gerade zu dieser Zeit in Paris waren, während sie sonst eventuell eher anderen Orten zugeordnet werden - dass also die Zeitangabe als eine Modifikation der Ortsangabe gemeint war.

Um diese Interpretationen zu leisten, muss das IR-System über eine Regelbasis verfügen, die die Domäne der Dokumente beschreibt. So sollte in einer solchen Basis z.B. stehen, dass eine Person, die ein Künstler oder eine Künstlerin ist, ein Geburtsdatum hat, dass sie entweder einen Todestag hat oder noch lebt, und dass der Todestag zeitlich nach dem Geburtstag liegt. Es kann aber natürlich auch vorkommen, dass ein Geburtstag nicht (genau) bekannt ist, oder dass zwei Daten in verschiedenen Zeitrechnungen angegeben sind. Auch solche Fälle müssen durch die Regeln der Regelbasis abgedeckt werden. Mit den Regeln dieser Basis werden die Anfragen interpretiert. Die Konstruktion einer solchen Regelbasis ist entsprechend aufwändig. Für neue Themengebiete müssen jeweils die gebietsspezifischen Regeln neu entwickelt werden.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Erweiterte Retrieval-Ansätze -> Logikbasierte Modelle des Information Retrieval
Dieser Abschnitt und seine Unterabschnitte
Inhalt
3.3.3Abduktive Anfrageoptimierung

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 17-11-2003 erzeugt.