Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Suche im World Wide Web -> Digitale Bibliotheken
Stichwörter dieser Seite Dublin Core, Archivierung
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.3.6.1: Inhalte einer digitalen Bibliothek

Während in den meisten klassischen Informationssystemen die Angebote eines Anbieters organisiert werden, müssen digitale Bibliotheken den Anspruch haben, zu einem Thema alle relevanten Quellen und Dokumente zu sammeln, unabhängig davon, in welchem Format sie vorliegen und von welchem Anbieter sie stammen. Allein die Beschreibung der Objekte, die eine digitale Bibliothek sammeln sollte, ist daher nicht trivial. In der Dublin-Core-Initiative hat man sich darauf geeinigt, nur von document like objects zu sprechen. Andere Autoren versuchen es mit Aufzählungen wie "article, book, web page, data item, video clip, map, drawing, photo, advertisement, animation" oder mit sehr allgemeinen Begriffen wie "data, information, and knowledge". Dabei werden vor allem Formate beschrieben, nicht aber die Inhalte der Objekte und ihre Rolle, die aber einer sinnvollen Definition zugrunde liegen sollte.

Um die Objekte, die in einer digitalen Bibliothek angeboten werden (sollten), nach inhaltlichen Kriterien zu bestimmen, kann man sich an den Funktionen und Diensten herkömmlicher Bibliotheken orientieren und diese auf digitale Objekte erweitern. In diesem Sinne könnte man die Aufgabe einer digitalen Bibliothek so beschreiben: Sie sichert den Zugang zu einer Sammlung von in sich abgeschlossenen Informationsobjekten, die für eine relevante Gruppe von Nutzenden für einen längeren Zeitraum gesammelt oder zugänglich gemacht werden (sollen) und von den Mitgliedern der Gruppe in der Form, in der sie präsentiert werden, verstanden und benutzt werden können.

Will man diesem Anspruch gerecht werden, stellen sich zum einen Probleme, die sich für herkömmliche Bibliotheken auch stellen, wie das der Auswahl der Publikationen und ihrer Einordnung in formale und inhaltliche Systematiken. Es stellen sich aber viele Fragen anders und einige ganz neu: Dazu gehören z.B. der Umgang mit der Vielfalt der Datenformate, in denen die Informationsobjekte vorliegen können, die technische und rechtliche Gewährleistung des Zugangs und die Kontrolle ihrer Herkunft, der angegebenen Autorenschaft und Authentizität des Inhalts.

Auch neue Verwertungs- und Urheberrechtsmodelle können neue Anforderungen an digitale Bibliotheken stellen. So kann es z.B. sein, dass von Verlagen nicht mehr ein Dokument - wie ein Buch - verkauft wird, sondern lediglich dessen zeitlich begrenzte Nutzung, dass also die Bibliothek nicht mehr garantieren kann, dass sie zu verschiedenen Zeiten denselben Inhalt anbietet; Ähnliches kann bei Angeboten passieren, die im Laufe der Zeit weiterentwickelt werden: Hier muss entschieden werden, welche der Versionen gespeichert und wie der Zugang zu den unterschiedlichen Versionen organisiert werden soll.

Angebote können auch aufgrund eines Profils dynamisch für bestimmte Nutzende erzeugt werden und je nach Profil unterschiedliche Inhalte oder Formate haben. Solche Dokumente lassen sich nur schlecht mit klassischen Bibliotheks- oder Archivobjekten vergleichen.

Um mit der Dynamik der Web-Inhalte umzugehen, kann man das, was ein Angebot zu einem Zeitpunkt an Daten liefert, unabhängig von den Anbietern archivieren. Solche Dienste bieten verschiedene Systeme im Web an (unter anderem Google [->] und Internet Archive [->] ). Diese Abzüge oder Snapshots bleiben bei wirklich dynamischen Web-Seiten natürlich lückenhaft. Das Gleiche gilt für Dokumente, die aufgrund von Profilen oder anderen Konstellationen zusammengestellt werden. Wenn nicht das gesamte System zur Verfügung steht, lassen sich solche dynamischen Angebote nicht im Sinne einer wortgetreuen Wiedergabe erfassen.

Noch schwieriger wird es mit Objekten, die weniger "Document Like Objects" sind, wie Simulationen, interaktive Lernsysteme oder elektronische Wörterbücher. Wenn sie nur als Ausgabe über das Netz erreichbar sind, also nicht selbst als Objekte "gesammelt" werden können, ist eine vollständige und "reproduzierbare" Archivierung oder Sammlung nicht möglich. Das heißt aber auch, dass ein Wiederauffinden - und damit eine der wichtigsten Funktion von Bibliotheken und Archiven - nicht sicher gewährleistet werden kann.

Aber nicht nur für die Wiederauffindbarkeit machen solche Angebote Probleme. Auch die inhaltliche Suche nach solchen Objekten ist schwierig. Möglich ist hier sicherlich die Beschreibung mit Metadaten, diese ist aber aufwändig und kann die Inhalte nur unvollständig erfassen.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Suche im World Wide Web -> Digitale Bibliotheken
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.3.6.1Inhalte einer digitalen Bibliothek
Dublin Core, Archivierung Archivierung, Dublin Core

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.