ZURÜCK

2.2.3: Information Retrieval: Definition und Abgrenzung

Für den Begriff bzw. das Gebiet des Information Retrieval gibt es keine allgemein akzeptierte Definition oder Abgrenzung. Historisch gesehen wurde IR zum besseren (Wieder)auffinden von wissenschaftlicher Literatur entwickelt. Auch wenn dieses Gebiet nach wie vor einer der Schwerpunkte des IR ist, haben sich sowohl der Bereich der Objekte, mit denen IR umgeht, als auch die Aufgabenstellungen erweitert. Eine Beschreibung gibt die Fachgruppe Information Retrieval der Gesellschaft für Informatik (zitiert nach Fuhr 1995 [->])

Im Information Retrieval (IR) werden Informationssysteme in bezug auf ihre Rolle im Prozeß des Wissenstransfers vom menschlichen Wissensproduzenten zum Informations-Nachfragenden betrachtet. Die Fachgruppe "Information Retrieval" in der Gesellschaft für Informatik beschäftigt sich dabei schwerpunktmäßig mit jenen Fragestellungen, die im Zusammenhang mit vagen Anfragen und unsicherem Wissen entstehen. Vage Anfragen sind dadurch gekennzeichnet, dass die Antwort a priori nicht eindeutig definiert ist. Hierzu zählen neben Fragen mit unscharfen Kriterien insbesondere auch solche, die nur im Dialog iterativ durch Reformulierung (in Abhängigkeit von den bisherigen Systemantworten) beantwortet werden können; häufig müssen zudem mehrere Datenbasen zur Beantwortung einer einzelnen Anfrage durchsucht werden. Die Darstellungsform des in einem IR-System gespeicherten Wissens ist im Prinzip nicht beschränkt (z. B. Texte, multimediale Dokumente, Fakten, Regeln, semantische Netze). Die Unsicherheit (oder die Unvollständigkeit) dieses Wissens resultiert meist aus der begrenzten Repräsentation von dessen Semantik (z. B. bei Texten oder multimedialen Dokumenten); darüber hinaus werden auch solche Anwendungen betrachtet, bei denen die gespeicherten Daten selbst unsicher oder unvollständig sind (wie z. B. bei vielen technisch-wissenschaftlichen Datensammlungen). Aus dieser Problematik ergibt sich die Notwendigkeit zur Bewertung der Qualität der Antworten eines Informationssystems, wobei in einem weiteren Sinne die Effektivität des Systems in bezug auf die Unterstützung des Benutzers bei der Lösung seines Anwendungsproblems beurteilt werden sollte.

Man sieht, dass diese Definition sehr allgemein gehalten ist. Dabei wird Wert darauf gelegt, die Vagheit, Unschärfe oder Unsicherheit zu betonen. Zur Bewertung soll der Nutzen für Menschen herangezogen werden. Auch Van Rijsbergen (1979 [->], zitiert nach der WWW-Version) gibt im ersten Kapitel tabellarisch eine Abgrenzung zwischen Information Retrieval und Fakten Retrieval (Data Retrieval), die diese Aspekte unterstreicht. (Die einzelnen Punkte erläutert er dann im Text weiter, siehe dort).

ZUGANGAbb. 12: Abgrenzung von Information Retrieval und Fakten Retrieval (Data Retrieval) nach Van Rijsbergen (1979)

Man kann diese Sichtweisen auch etwas anders akzentuieren. Wie auch am Anfang der Definition der Fachgruppe IR festgestellt, dienen IR Verfahren dazu, Wissen zwischen Menschen zu vermitteln. Daher müssen Aspekte der Wissensverarbeitung beim Menschen und damit auch Fragestellungen und Methoden aus den Fachgebieten, die sich mit diesem Thema beschäftigen, also z. B. der kognitiven Psychologie, der Sprachpsychologie und der Gedächtnispsychologie berücksichtigt werden. In diesen Disziplinen sind noch viele Fragen ungeklärt. Was allerdings mit ziemlicher Sicherheit gesagt werden kann, ist, dass menschliche Informationsverarbeitung durch keines der bisher vorgeschlagenen Modelle, wie deduktive Logik oder neuronale Netze, vollständig beschrieben werden kann. Ein großer Teil der Vagheit des IR rührt also daher, dass es zwischen der Informatik und den Kognitionswissenschaften anzusiedeln ist und damit ingenieurwissenschaftliche und humanwissenschaftliche Anteile enthält.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber