Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Suche im World Wide Web -> Digitale Bibliotheken
Stichwörter dieser Seite Archivierung, Langzeitarchivierung, Formatmigration
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.3.6.3: Archivierung

Eine weitgehend ungeklärte Frage stellt die Langzeitarchivierung von und damit auch der dauerhafte Zugang zu digitalen Objekten dar. Dieses Problem stellt sich zwar auch bei Papierdokumenten - während man dort aber im Allgemeinen von Zeitspannen von Jahrzehnten bis Jahrhunderten ausgeht, liegen die Zeitspannen bei digitalen Objekten eher im Bereich von Jahren, also mindestens um einen Faktor zehn niedriger.

Das Problem stellt sich auf mehreren Ebenen: Zunächst sind (und insbesondere waren) elektronische Datenträger nicht sonderlich langlebig; bei Magnetbändern kann sich z.B. die Magnetschicht lösen oder die Magnetisierung nachlassen. Dabei können - im Gegensatz zu von Menschen gelesenen Papierdokumenten - auch kleine lokale Störungen dazu führen, dass der Zugang zum Inhalt ganzer Dateien enorm erschwert, wenn nicht unmöglich wird. Ein größeres Problem stellt aber das Lesen und die Interpretation der Daten dar: Ohne die notwendige Hard- und Software ist auch eine vollständig erhaltene binäre Datei in der Regel nutzlos. So gab es Ende der 1990er Jahre z.B. ein Forschungsprojekt, in dem versucht wurde, die Kodierung von Lochstreifen, wie sie in den 1960er Jahren verwendet wurden, zu entschlüsseln. Auch diverse Datenbestände von frühen Raumflügen der NASA sind nicht mehr zugänglich. Im Kleinen stellen sich diese Probleme bereits, wenn z.B. Textverarbeitungsprogramme nicht mehr angeboten werden oder Speichermedien aus der Mode kommen.

Zur Lösung der Probleme gibt es mehrere Ansätze: Zum einen kann man versuchen, möglichst standardisierte Datenformate zu verwenden, deren Interpretation in den Standards festgelegt sind. Zum anderen kann man versuchen, außer den eigentlichen Daten auch die Hard- und Software, mit der sie gelesen werden können, zu erhalten. Schließlich kann man die Daten rechtzeitig in neue Formate konvertieren (Formatmigration), von denen man hoffen kann, dass sie möglichst lange lesbar bleiben. Alle drei Methoden haben offensichtliche Schwachstellen:

Standards schränken häufig die Ausdrucksmächtigkeit ein oder sind so kompliziert, dass sie nicht wirklich erfüllt werden. Auch scheinen einige Software-Hersteller wenig Interesse an der Erfüllung von Standards zu haben.

Der Hard- und Software-Archivierung sind Grenzen gesetzt: Spätestens wenn der letzte Rechner kaputt geht, können die Daten nicht mehr präsentiert und genutzt werden. Damit geht ein wesentlicher Vorteil digitaler Archivierung verloren, nämlich der, dass (durch beliebige Kopierbarkeit) der Gebrauch der Objekte ihre Erhaltung nicht beeinträchtigt.

Die Formatmigration setzt voraus, dass die Beschreibung der Inhalte voll verstanden wurde. Das kann bei komplexen oder proprietären Formaten schwierig sein. Es muss vor der Konversion entschieden werden, welche Aspekte der Inhalte erhalten bleiben sollen. So sind z.B. viele der frühen Web-Seiten nicht nur verloren, weil sie nicht archiviert wurden, auch das "Look and Feel" der Seiten, die noch erhalten sind, ist verändert, wenn sie mit einem anderen Browser dargestellt werden. Es gibt unterdessen allerdings auch Web-Dienste, die die frühen Browser emulieren, um genau dieses "Look and Feel" wieder anzubieten (Lannerö, 2002 [->] ).

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Suche im World Wide Web -> Digitale Bibliotheken
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.3.6.3Archivierung
Archivierung, Langzeitarchivierung, Formatmigration Archivierung, Formatmigration, Langzeitarchivierung

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.