ZURÜCK

2.2.2: Struktur eines Information Retrieval Systems

Wird diese Definition auf die Struktur eines Informationssystems aus Abbildung _10_ angewendet, so stellt die Repräsentation der Objekte eine Wissenssammlung dar. Das Informationssystem macht aus diesem Wissen Information, indem es einen spezifischen Informationsbedarf bedient.

Die schematische Darstellung zeigt nur die Grundstruktur eines Informationssystems. Es kann weitere Wissensbasen enthalten, die dazu dienen, die Kommunikation im oben beschriebenen Sinne zu unterstützen. Sie können z. B. dazu dienen, die Repräsentation der Objekte oder des Informationsbedarfs zu konstruieren, indem sie Weltwissen über die Domäne, in der das Informationssystem arbeitet, enthalten, wie es z. B. häufig in Expertensystemen der Fall ist. Eine Repräsentation kann auch mehrere Repräsentationsformate enthalten, die auseinander abgeleitet werden, wie wir im nächsten Abschnitt am Beispiel einer Literaturdatenbank sehen werden. Dabei gilt aber grundsätzlich, dass die Repräsentationen die Objekte so gut beschreiben müssen, dass sie unterschieden werden können, wenn das nötig ist.

ZUGANG2.2.2.1: Zum Beispiel: Boolesches Retrieval in Literaturdatenbanken

Wie beim Booleschen Retrieval werden in fast allen IR Systemen die Dokumente intern nochmals vereinfacht repräsentiert. Diese Vereinfachung ist nicht nur technisch bedingt, sie ist gleichzeitig auch eine Art Verallgemeinerung des Inhalts der Dokumente, die notwendig ist, um erfolgreich suchen zu können: Wenn zum Suchen immer eine vollständige Beschreibung des Inhalts gegeben werden müsste, wäre die Suche häufig überflüssig. Eines der Hauptthemen der IR Forschung der letzten 30 Jahre ist die Entwicklung und der Vergleich von internen Repräsentationsformen und darauf beruhenden Vergleichsverfahren.

Was für Textdokumente gesagt wurde, gilt auch für andere Objekte, wie Bilder, Videos, Audiodokumente: ihre Speicherung in Rechnern erlaubt fast nie eine inhaltliche Erschließung. Um aus einem Pixelmuster zu schließen, ob es sich dabei um ein Gemälde von Rembrandt, ein aktuelles Foto eines Politikers oder um eine Bierreklame handelt, sind weitere Verfahren notwendig, die gegenwärtig Thema der Forschung sind und es auch noch eine ganze Weile bleiben dürften.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber