Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Einführende Beispiele
Stichwörter dieser Seite Faktendatenbank, Datenbankmanagementsystem, DBMS, Konsistenz
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.1.4: Faktendatenbanken und -retrieval

Während die Dokumente in Literaturdatenbanken zwar in verschiedene Felder strukturiert sind, innerhalb vieler dieser Felder aber freien Text beliebiger Länge enthalten, sind die Einträge in Faktendatenbanken im Allgemeinen stark strukturiert. Das heißt, sie bestehen (logisch) aus Tupeln von Werten, für die bekannt ist, welchen Datentyp sie haben - ob es sich also beispielsweise um Zahlen, Zeitangaben, Preise, Eigennamen oder freie Text handelt. Abbildung 3 zeigt eine fiktive Beispieldatenbank mit unterschiedlichen Datentypen. Faktendatenbanken werden im Allgemeinen mit relationalen Datenbankmanagementsystemen (DBMS) verwaltet. Diese Systeme sorgen neben der Suche vor allem für die Konsistenz und Sicherheit der verwalteten Daten, auch wenn sie von mehreren Nutzenden gleichzeitig bearbeitet - und insbesondere geändert - werden. Dieser Aspekt wird von IR-Systemen in der Regel nicht berücksichtigt und soll hier auch nicht näher betrachtet werden (siehe z.B. Grossman und Frieder, 1998 [->] , chapter 5).

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 3: Beispieldatenbank mit Wohnungsangeboten

Die starke Strukturierung der Datensätze erleichtert den Zugriff auf die Einträge und das Arbeiten mit ihnen, da die Typisierung das Format vorgibt und wohl definierte Vergleiche ermöglicht. Diese Stärke kommt vor allem zum Tragen, wenn exakte Anfragen gestellt werden, wie - um bei der Beispieldatenbank zu bleiben - "suche eine Wohnung mit einer Quadratmeterzahl zwischen 65 und 85 und einer Kaltmiete unter 500 Euro". Wenn die Anfragen allerdings vager werden, müssen die Werte häufig wieder interpretiert werden, wenn für Anfragende nützliche Ergebnisse erzielt werden sollen. So kann man versuchen, einen Informationsbedarf wie "Suche stadtnahe, kostengünstige Wohnung für zwei Personen" in eine Anfrage mit den gegebenen Attributen zu übersetzen. Dazu ist es aber notwendig, weiteres Wissen über das Gebiet zu haben, aus dem die Datensätze sind, und dieses auch in geeigneter Weise nutzen zu können.

Nicht nur durch einen vagen Informationsbedarf können Probleme entstehen. Es kann auch vorkommen, dass die gewünschte Information nicht in der Darstellung der Objekte in der Datenbank vorhanden ist oder eventuell überhaupt nicht geeignet beschrieben werden kann. So lässt sich in einer Faktendatenbank über Bücher gegebenenfalls einfach feststellen, dass ein Buch mit 200 Seiten mehr Seiten hat als eines mit 150 (weil der Datentyp Ordinalskalenniveau hat - oder anders gesagt, weil man für zwei verschiedene natürliche Zahlen immer sagen kann, welche größer ist). Dagegen kann es erheblich schwieriger zu entscheiden sein, welches von zwei Büchern sich besser dazu eignet, sich in ein bestimmtes Thema einzuarbeiten (weil dafür keine Attribute angegeben sind oder weil für die entsprechenden Attributwerte kein offensichtlicher Vergleichsoperator existiert). Andererseits wird in vielen Fällen die zweite Art von Information nützlicher sein als die erste, wenn es darum geht, sich zwischen zwei Büchern zu entscheiden.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Einführende Beispiele
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.1.4Faktendatenbanken und -retrieval
Abb. 3 Beispieldatenbank mit Wohnungsangeboten
Faktendatenbank, Datenbankmanagementsystem, DBMS, Konsistenz Datenbankmanagementsystem, DBMS, Faktendatenbank, Konsistenz

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.