ZURÜCK

5.2: Der probabilistische Retrieval Ansatz

Die Information Retrieval Modelle aus Teil _3_ lassen sich als einfache Systeme aus Mengen, Transformationen, Attributen und Ähnlichkeitsfunktionen darstellen. Dabei werden Verfahren, mit denen bestimmte Teilmengen der Dokumentmenge, bzw. Ähnlichkeitsrangfolgen zu einer Anfrage bestimmt werden können, verwendet aber kein ausgearbeitetes Modell der Informationssuche konstruiert. Im folgenden soll ein etwas weiter ausgearbeitetes probabilistisches Modell vorgestellt werden, wie es in Fuhr (1995 [->]) zu finden ist.

In der Einleitung war darauf hingewiesen worden, dass Information Retrieval im Gegensatz zu Faktenretrieval immer nur nach relativ besten Lösungen oder Antworten suchen kann und im Allgemeinen keine eindeutige beste Lösung existiert. Daher liegt es nahe, IR mit einem probabilistischen Ansatz zu modellieren.

Die diesem Ansatz zugrundeliegende Frage kann folgendermaßen formuliert werden:

Wie groß ist die Wahrscheinlichkeit, dass ein gegebenes Dokument d für eine Anfrage q als relevant eingeschätzt wird.

Hätte man diese Wahrscheinlichkeit für jede Anfrage und für alle Dokumente, könnte man alle Dokumente danach sortieren und die mit der größten Wahrscheinlichkeit ausgeben. Da diese Wahrscheinlichkeit aber nicht unmittelbar zugänglich ist, kann man versuchen, sie zu schätzen. Dazu müssen die Dokumente und die Anfragen weiter untersucht werden und entsprechende Vereinfachungen und Unabhängigkeitsannahmen gemacht werden.

ZUGANG5.2.1: Wahrscheinlichkeitsrechnung in endlichen Mengen

ZUGANG5.2.2: Abschätzung des Retrievalstatuswerts nach Fuhr

ZUGANG5.2.3: Die Robertson - Spark Jones Formel

Das Verwenden von Trainingssets bzw. von (pseudo) Relevanz-Feedback-Daten macht - in einer theoretischen Perspektive - aus der Gewichtungsfunktion eine Lernaufgabe: Es werden solche Terme stärker gewichtet, die sich in anderen Beispielen als gute Indikatoren für die Relevanz eines Dokuments zu einer Anfrage bewährt haben.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber