Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Grundlagen -> Information Retrieval
Stichwörter dieser Seite Fakten-Retrieval, World Wide Web
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.2.3.3: Information Retrieval: Definition und Abgrenzung

Für den Begriff bzw. das Gebiet des Information Retrieval gibt es keine allgemein akzeptierte Definition oder Abgrenzung. Historisch gesehen wurde IR zum besseren (Wieder)auffinden von wissenschaftlicher Literatur entwickelt.

Eine Beschreibung gibt die Fachgruppe Information Retrieval der Gesellschaft für Informatik ([->] ):

"Im Information Retrieval (IR) werden Informationssysteme in bezug auf ihre Rolle im Prozess des Wissenstransfers vom menschlichen Wissensproduzenten zum Informations-Nachfragenden betrachtet. Die Fachgruppe "Information Retrieval" in der Gesellschaft für Informatik beschäftigt sich dabei schwerpunktmäßig mit jenen Fragestellungen, die im Zusammenhang mit vagen Anfragen und unsicherem Wissen entstehen. Vage Anfragen sind dadurch gekennzeichnet, daß die Antwort a priori nicht eindeutig definiert ist. Hierzu zählen neben Fragen mit unscharfen Kriterien insbesondere auch solche, die nur im Dialog iterativ durch Reformulierung (in Abhängigkeit von den bisherigen Systemantworten) beantwortet werden können; häufig müssen zudem mehrere Datenbasen zur Beantwortung einer einzelnen Anfrage durchsucht werden. Die Darstellungsform des in einem IR-System gespeicherten Wissens ist im Prinzip nicht beschränkt (z.B. Texte, multimediale Dokumente, Fakten, Regeln, semantische Netze). Die Unsicherheit (oder die Unvollständigkeit) dieses Wissens resultiert meist aus der begrenzten Repräsentation von dessen Semantik (z.B. bei Texten oder multimedialen Dokumenten); darüber hinaus werden auch solche Anwendungen betrachtet, bei denen die gespeicherten Daten selbst unsicher oder unvollständig sind (wie z.B. bei vielen technisch-wissenschaftlichen Datensammlungen). Aus dieser Problematik ergibt sich die Notwendigkeit zur Bewertung der Qualität der Antworten eines Informationssystems, wobei in einem weiteren Sinne die Effektivität des Systems in bezug auf die Unterstützung des Benutzers bei der Lösung seines Anwendungsproblems beurteilt werden sollte."
Man sieht, dass diese Definition sehr allgemein gehalten ist. Dabei wird Wert darauf gelegt, die Vagheit, Unschärfe oder Unsicherheit zu betonen. Zur Bewertung soll der Nutzen für Menschen herangezogen werden. Abbildung 12 zeigt eine tabellarische Abgrenzung von Information Retrieval und Fakten-Retrieval nach Van Rijsbergen (1979) [->] , die in die gleiche Richtung weist.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 12: Abgrenzung von Information Retrieval und Fakten Retrieval (Data Retrieval) nach Van Rijsbergen (1979)

Man kann diese Sichtweisen auch etwas anders akzentuieren. Wie auch am Anfang der Definition der Fachgruppe IR festgestellt, dienen IR-Verfahren dazu, Wissen zwischen Menschen zu vermitteln. Daher müssen Aspekte der Wissensverarbeitung beim Menschen und damit auch Fragestellungen und Methoden aus den Fachgebieten, die sich mit diesem Thema beschäftigen, also z.B. der kognitiven Psychologie, der Sprachpsychologie und der Gedächtnispsychologie, berücksichtigt werden. In diesen Disziplinen sind noch viele Fragen ungeklärt. Mit ziemlicher Sicherheit kann allerdings gesagt werden, dass menschliche Informationsverarbeitung durch keines der bisher vorgeschlagenen Modelle - wie deduktive Logik oder neuronale Netze - vollständig beschrieben werden kann. Ein großer Teil der Vagheit des IR rührt also daher, dass es zwischen der Informatik und den Kognitionswissenschaften anzusiedeln ist und damit ingenieurwissenschaftliche und humanwissenschaftliche Anteile enthält.

In den letzten Jahren haben sich sowohl die Objekte, mit denen IR umgeht bzw. umgehen muss, als auch die Aufgabenstellungen stark erweitert. Insbesondere das World Wide Web hat Information Retrieval zu einem Thema gemacht, das (plötzlich) eine breite Öffentlichkeit betrifft und teilweise auch interessiert. Dabei haben sich die Rahmenbedingungen für IR-Systeme deutlich verändert. Auf diese Veränderungen wird in Teil 4 genauer eingegangen.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Grundlagen -> Information Retrieval
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.2.3.3Information Retrieval: Definition und Abgrenzung
Abb. 12 Abgrenzung von Information Retrieval und Fakten Retrieval (Data Retrieval) nach Van Rijsbergen (1979)
Fakten-Retrieval, Fakten-Retrieval, Data Retrieval, World Wide Web Data Retrieval, Fakten-Retrieval, Fakten-Retrieval, World Wide Web

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.