Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Suche im World Wide Web -> Das Web als Dokumentensammlung
Stichwörter dieser Seite expires
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.3.1.4: Dynamik und Alter von Web-Seiten

Das Web ist im Prinzip ein sehr aktuelles Medium, weil neue Dokumente und Änderungen allen Nutzenden direkt zur Verfügung stehen, wenn sie auf einem bekannten Server bereitgestellt werden. Für Suchmechanismen bedeutet das, dass sie ständig aktualisiert werden müssen, um nicht zu veralten. Gleichzeitig bietet das Web verhältnismäßig gute Möglichkeiten, Dokumente längerfristig und auch, wenn sie nicht mehr unmittelbar aktuell sind, quasi als Archiv weiter anzubieten, da die Kosten für den benötigten Speicherplatz minimal sind.

In der Praxis erlebt man allerdings häufig, dass Web-Seiten oder ganze Angebote nicht mehr unter einer bekannten Adresse zu finden sind oder ganz aus dem Web verschwunden zu sein scheinen. So ist zu erwarten, dass viele Web-Adressen im Literaturverzeichnis des zu diesen Seiten gehörenden Buchs schon bald nicht mehr zu den genannten Dokumenten führen werden. Das kann daran liegen, dass Angebote oder die Institutionen, die sie anbieten, umorganisiert werden, oder daran, dass Dokumente durch neuere Versionen überschrieben werden. Die Möglichkeiten, die das Web z.B. durch Verweise auf ältere Versionen oder durch das Dublin-Core-Refinement-Element Replaces bietet, werden kaum genutzt.

Aber auch wenn Web-Seiten dauerhaft angeboten werden, kann das zu Problemen für die automatisierte Suche im Netz führen: Es ist in der Regel nicht einfach, automatisch zu entscheiden, ob eine Seite aktuelle Informationen enthält, für den langfristigen Gebrauch bestimmt ist, aus historischen Gründen quasi als Archiv weiterhin angeboten wird oder schlicht und einfach vergessen wurde.

Auch Datum und Ablaufdatum (expires) einer Seite sind dabei nicht immer hilfreich. Das Datum gibt an, wann die Datei zum letzten Mal auf dem Server gespeichert wurde. Das muss nicht unbedingt auch das Datum der letzten (wesentlichen) inhaltlichen Änderung sein, wenn z.B. der gesamte Server "umgezogen" ist. Wenn die Datei über eine Datenbank oder ein anderes "Content-Management-System" jeweils erst bei der Abfrage generiert wird, hängt es von diesem System ab, ob überhaupt ein Datum mitgeliefert wird und ob dieses Datum das der letzten inhaltlichen Änderung ist. Ablaufdaten müssen nicht angegeben werden, und wenn sie angegeben sind, ist auch nicht immer klar, was sie genau aussagen: In vielen Fällen ist zum Zeitpunkt, an dem ein Angebot erstellt wird, nicht klar, wie lange es "Gültigkeit" haben soll. Insbesondere kleine Angebote von Privatpersonen, Initiativen und Projekten werden oft weiter im Netz angeboten, aber nicht mehr gepflegt. Auch wenn nur auf der Einstiegsseite eines Angebots darauf hingewiesen wird, dass es nicht mehr gepflegt wird oder dass es sich um ein "Archiv" handelt, wird das auf den Folgeseiten in der Regel nicht sichtbar.

Um den Informationsbedarf von Nutzenden zu erfüllen, kann es wichtig sein, Web-Seiten nach den oben beschriebenen Merkmalen zu unterscheiden. Das ist aber in der Regel nicht möglich, auch wenn Datum und Ablaufdatum angegeben sind. Was bleibt, ist der Versuch, die Unterscheidungen mit Hilfe von Einschränkungen der beiden Daten zu erreichen, soweit sie denn angegeben und verlässlich sind.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Suche im World Wide Web -> Das Web als Dokumentensammlung
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.3.1.4Dynamik und Alter von Web-Seiten
expires expires

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.