ZURÜCK

1.2: Beispiel einer Datenbankrecherche

Will man z. B. Literatur zum Stand der Forschung im Bereich Retrieval Systeme für Multimedia-Objekte mit einem besonderen Schwerpunkt auf der Frage, wie Bilder behandelt werden, suchen, kann man z. B. die Datenbank INSPEC verwenden. Sie besteht aus Dokumenten, die Artikel und Bücher beschreiben, indem sie neben bibliographischen Angaben eine Kurzzusammenfassung ( Abstract oder auch Referat), eine Einordnung in ein hierarchisches Indexsystem und Stichwörter enthalten.

Für andere Fachgebiete und Sprachen gibt es andere Datenbanken. Abbildung 1 zeigt z. B. einen Eintrag aus der psychologischen Literaturdatenbank PSYNDEX die von der Zentralstelle für psychologische Information und Dokumentation an der Uni Trier erstellt und angeboten wird.

ZUGANGAbb. 1: Dokument aus der Literaturdatenbank PSYNDEX

Auf die Eingabe von (Kombinationen von) Wörtern liefert das (Boolesche) Retrievalsystem von INSPEC die Dokumente, die die Wörter in der angegebenen Form enthalten (Genaueres siehe Abschnitt 3.1 ). Um ein gutes Suchergebnis zu erzielen, sollte man deshalb zunächst überlegen, welche Stichwörter das Problem besonders gut beschreiben. Das sollten Wörter sein, die spezifisch für die Fragestellung sind, aber dann doch wieder so allgemein, dass man annehmen kann, dass sie in jedem "wichtigen" Artikel vorkommen.

Eine Anfrage mit den Stichwörtern "Retrieval Systems", "Multimedia" und "Images" könnte z. B. so aussehen:

RETRIEVAL SYSTEMS and MULTIMEDIA and IMAGES
.

Sie wird vom Retrieval System so interpretiert: Suche alle Dokumente, in denen jede der drei Zeichenketten "RETRIEVAL SYSTEMS", "MULTIMEDIA" und "IMAGES" mindestens einmal irgendwo im Text vorkommt. Dabei wird nicht zwischen Groß- und Kleinbuchstaben unterschieden, und das Leerzeichen zwischen RETRIEVAL und SYSTEMS kann auch ein anderer " white space" sein (also z. B. ein Zeilenumbruch, auch in Verbindung mit mehreren Leerzeichen)

Die Suche lieferte für die Zeit von Januar bis Juni 1995 drei Einträge: "Image Engine: an object-oriented multimedia database for storing, retrieving and sharing medical images and text", "Multimedia information retrieval using knowledge in encyclopedia texts", "Images database management system: a 'server-client producer' system on a local network and on the Internet".

Nun sind drei Dokumente nicht gerade viel. Man kann also versuchen, die Anfrage etwas allgemeiner zu machen. Wenn die folgende Anfrage verwendet wird:

RETRIEVAL and MULTIMEDIA and IMAGE$
finden sich immerhin 35 Dokumente für den selben Zeitraum. Dabei ist
$
eine Wildcard, d.h.
IMAGE$
bezeichnet alle Wörter, die mit der Zeichenkette
IMAGE
beginnen). In der Ergebnisliste finden sich Titel wie: "PhotoFile: a digital library for image retrieval", "Spatial knowledge representation and retrieval in 3 - D image databases", "Multimedia retrieval technology", "A WWW interface to the OMNIS/Myriad literature retrieval engine", "Problems of content-based retrieval in image databases", die auf den ersten Blick nicht weniger relevant aussehen, als die oben genannten. Weitere Verallgemeinerungen der Anfrage und ihre Treffermengen sind in der Tabelle in Abbildung 2 angegeben.

ZUGANGAbb. 2: Anzahl der in INSPEC gefundenen Dokumente für die Zeit vom Januar bis Juni 1995

Zu den Titeln aus der Ergebnisliste können noch die vollständigen bibliographischen Angaben, die auch ein Abstract und Einordnungen in verschiedene Ordnungs- und Beschreibungssysteme enthalten, abgerufen werden, wie sie in Abbildung _1_ für die psychologische Datenbank gezeigt wurden. Die vollständigen Artikel müssen aber auf anderen Wegen, also z. B. aus der Bibliothek über die Fernleihe oder durch einen Lieferdienst beschafft werden. Neuere Systeme bieten auch die Möglichkeit, die vollständigen Artikel elektronisch zu bestellen oder unmittelbar als Volltextdatei zu beziehen. Die Probleme, die sich dabei ergeben sind im Allgemeinen eher ökonomischer oder organisatorischer Natur als technischer.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber