Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Einführende Beispiele
Stichwörter dieser Seite Recherche in einer Literaturdatenbank, INSPEC, Kurzzusammenfassung, Abstract, Referat, Stichwort, PSYNDEX, ZPID, Literaturverweis, Referenz, Stichwort, white space, Wildcard
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.1.3: Recherche in einer Literaturdatenbank

Will man beispielsweise Literatur zum Stand der Forschung im Bereich Retrieval-Systeme für Multimedia-Objekte mit einem besonderen Schwerpunkt auf der Frage suchen, wie Bilder behandelt werden, könnte man die Datenbank INSPEC verwenden. Sie besteht aus Dokumenten, die Artikel und Bücher beschreiben, indem sie neben bibliografischen Angaben eine Kurzzusammenfassung (Abstract oder auch Referat), eine Einordnung in ein hierarchisches Klassifikationssystem und Stichwörter enthalten.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 1: Dokument aus der Literaturdatenbank PSYNDEX

Für andere Fachgebiete und Sprachen gibt es andere Literaturdatenbanken. Abbildung 1 zeigt einen Eintrag aus der psychologischen Literaturdatenbank PSYNDEX, die vom Zentrum für psychologische Information und Dokumentation (ZPID) an der Uni Trier erstellt und angeboten wird. In diesem Eintrag wird ein Zeitschriftenartikel beschrieben. Neben detaillierten bibliografischen Angaben, wie Autoren, Titel, Erscheinungsjahr und Anzahl der Literaturverweise (Referenzen), enthält der Eintrag eine ausführliche Beschreibung des Inhalts und fast zehn verschiedene Felder zur systematischen inhaltlichen Erfassung. Insgesamt gibt es in PSYNDEX 52 Feldbezeichner, aus denen Beschreibungsformate zusammengestellt werden können. In Abbildung 1 sind die ausgeschriebenen Namen der verwendeten Felder in Klammern hinter den Kürzeln aufgeführt.

Die Suche in solchen Literaturdatenbanken geht folgendermaßen vonstatten: Auf die Eingabe von (Kombinationen von) Wörtern liefert das (boolesche) Retrieval-System von INSPEC die Dokumente, die die Wörter in der angegebenen Form enthalten (Genaueres siehe Abschnitt 1.3.1 ). Um ein gutes Suchergebnis zu erzielen, sollte man deshalb zunächst überlegen, welche Stichwörter das Problem besonders gut beschreiben. Es sollten Wörter sein, die spezifisch für die Fragestellung sind, aber doch wieder so allgemein, dass man annehmen kann, dass sie in jedem "wichtigen" Artikel vorkommen.

Eine Anfrage mit den Stichwörtern Retrieval Systems, Multimedia und Images könnte z.B. so aussehen:
retrieval systems AND multimedia AND images.
Sie wird vom Retrieval-System so interpretiert: Suche alle Dokumente, in denen jede der drei Zeichenketten retrieval systems, multimedia und images mindestens einmal irgendwo im Text vorkommt. Dabei wird nicht zwischen Groß- und Kleinbuchstaben unterschieden, und das Leerzeichen zwischen retrieval und systems kann auch ein anderer "white space" sein (also z.B. ein Zeilenumbruch, auch in Verbindung mit mehreren Leerzeichen).

Die Suche in der Literaturdatenbank INSPEC lieferte für die Zeit von Januar bis Juni 1995 drei Einträge: "Image Engine: an object-oriented multimedia database for storing, retrieving and sharing medical images and text", "Multimedia information retrieval using knowledge in encyclopedia texts", "Images database management system: a `server-client producer' system on a local network and on the Internet".

Nun sind drei Dokumente nicht gerade viel. Man kann also versuchen, die Anfrage etwas allgemeiner zu formulieren. Wenn die folgende Anfrage verwendet wird: retrieval AND multimedia AND image$, finden sich immerhin 35 Dokumente für denselben Zeitraum. Dabei ist $ eine Wildcard, image$ bezeichnet also alle Wörter, die mit der Zeichenkette image beginnen. In der Ergebnisliste finden sich Titel wie: "PhotoFile: a digital library for image retrieval", "Spatial knowledge representation and retrieval in 3-D image databases", "Multimedia retrieval technology", "A WWW interface to the OMNIS/Myriad literature retrieval engine", "Problems of content-based retrieval in image databases". Sie sehen auf den ersten Blick nicht weniger relevant aus als die oben genannten. Weitere Verallgemeinerungen der Anfrage und ihre Treffermengen sind in Abbildung 2 angegeben.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 2: Anzahl der in INSPEC gefundenen Dokumente im ersten Halbjahr 1995

Zu den Titeln aus der Ergebnisliste können noch die vollständigen bibliografischen Angaben abgerufen werden, ähnlich wie sie in Abbildung 1 für die psychologische Datenbank gezeigt wurden. Sie enthalten auch ein Abstract und Einordnungen in verschiedene Ordnungs- und Beschreibungssysteme. Die vollständigen Artikel müssen aber auf anderen Wegen, also z.B. aus der Bibliothek, über die Fernleihe oder durch einen Lieferdienst, beschafft werden. Neuere Systeme bieten auch die Möglichkeit, die vollständigen Artikel elektronisch zu bestellen oder unmittelbar als Volltextdatei zu beziehen. Die Probleme, die sich dabei ergeben, sind im Allgemeinen eher ökonomischer oder organisatorischer Natur als technischer.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Einführende Beispiele
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.1.3Recherche in einer Literaturdatenbank
Abb. 1 Dokument aus der Literaturdatenbank PSYNDEX
Abb. 2 Anzahl der in INSPEC gefundenen Dokumente im ersten Halbjahr 1995
Recherche in einer Literaturdatenbank, INSPEC, Kurzzusammenfassung, Abstract, Referat, Stichwort, PSYNDEX, ZPID, Literaturverweis, Referenz, Stichwort, white space, Wildcard Abstract, INSPEC, Kurzzusammenfassung, Literaturverweis, PSYNDEX, Recherche in einer Literaturdatenbank, Referat, Referenz, Stichwort, Stichwort, white space, Wildcard, ZPID

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.