ZURÜCK

2.2.1: Daten, Wissen, Information

Bisher wurden die Begriffe Daten, Wissen und Information weitgehend unsystematisch und intuitiv gebraucht. Dieser unterschiedliche Wortgebrauch zieht sich auch durch die Literatur zum Information Retrieval. Auch wenn im Folgenden zwei verschiedene Ansätze zu Definitionen gegeben werden, werde ich mich in den weiteren Kapiteln nicht immer an diese Definitionen halten, sondern oft den im allgemeinen üblichen unscharfen Sprachgebrauch verwenden.

Der Begriff Information wird in vielen verschiedenen Disziplinen und Teilgebieten unterschiedlich (wenn überhaupt) definiert. Dabei gibt es eher pragmatische ad hoc Definitionen und Versuche, die Sache eher grundsätzlich anzugehen. Ein Versuch der zweiten Art ist in einem Artikel von R. Losee (1997 [->]) nachzulesen. Er weist zunächst darauf hin, dass Information im Allgemeinen als etwas angesehen wird, das neu ist, richtig oder wahr ist und von etwas handelt. Er schlägt als Verallgemeinerung dieser Beobachtung vor, Information disziplinenübergreifend als die Eigenschaften des Ergebnisses eines Prozesses zu definieren, die Rückschlüsse auf den Input des Prozesses zulassen. Diese Definition lässt sich gut am Diagramm aus Abbildung _8_ veranschaulichen: Aus der Perspektive des Empfängers soll auf den Input des Senders rückgeschlossen werden. Diese Sichtweise macht besonders deutlich, dass Information immer bis zu einem gewissen Grad bereits vorhandenes Wissen voraussetzt: Ohne solches Wissen kann das Ergebnis des Übertragungskanals nur so akzeptiert werden, wie es vorgefunden wird; jede Plausibilitätsprüfung setzt Wissen über die zu erwartende Struktur voraus.Praktisch lässt sich das wieder beim Lesen eines Texts veranschaulichen: bei einem Schreibfehler nehmen Lesende an, dass beim Schreiben des Textes das "richtige" Wort gemeint war. Dieser Rückschluss setzt natürlich erhebliche Kentnisse über die Sprache voraus, in der der Text abgefasst ist.

Es ist also nicht so schwierig, ein gegebenes Modell oder eine speziellere Definition auf diese allgemeine Definition zurückzuführen. Es ist aber die Frage, ob aus der allgemeinen Definition nützliche allgemeingültige Folgerungen abgeleitet werden können.

Deshalb ist es häufig sinnvoll eine engere Definition zu wählen. Im folgenden werden Definitionen der drei Begriffe Daten, Wissen und Information gegeben, wie sie bei Fuhr (1997 [->]) zu finden sind. Als Daten werden danach Einträge bezeichnet, deren Typ oder syntaktische Struktur bekannt ist. Das kann z. B. eine Bitfolge sein, die als Liste von Integerzahlen zu interpretieren ist, oder ein Record aus verschiedenen Datentypen. Ist zu den Einträgen eine Semantik gegeben, ist also bekannt, was in einem Eintrag steht, bzw. welche Eigenschaft eines Objektes er repräsentiert, spricht man von Wissen. Stellt die Folge von Integerzahlen z. B. die Anzahl der Zuhörenden verschiedener Vorlesungen dar, handelt es sich im Sinne der Definition um Wissen über diese Anzahlen. In diesem Sinne enthalten Datenbanken Wissen, soweit mit dem Schema der Datenbank die semantische Interpretation der Einträge festgelegt ist. Information wird in dieser Defininition schließlich an eine konkrete Situation gebunden. Sie ist, wie Fuhr Kuhlen (1990 [->]) zitiert "... die Teilmenge von Wissen, die von jemandem in einer konkreten Situation zu Lösung von Problemen benötigt wird." Das heißt, dass Wissen dadurch zu Information wird, dass es zu einem bestimmten Zeitpunkt in einer bestimmten Situation benötigt wird.

Um diese Unterscheidung an einem weiteren Beispiel darzustellen, kann man eine Sammlung von Records, die aus je zwei Textstrings der Länge 255 und einer Integerzahl bestehen betrachten. Bei Einträgen mit einer solchen Recordstruktur spricht man von Daten. Ist bekannt, dass die ersten beiden Textfelder jedes Records als Namen einer Person zu interpretieren sind und das folgende Zahlenfeld als deren Geburtsdatum, handelt es sich um eine Wissensammlung. Wird schließlich aus dieser Wissenssammlung das Geburtsdatum einer Person herausgesucht, so ist das Ergebnis im Sinne der obigen Definition eine Information.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber