ZURÜCK

4.7: Metadaten

SGML ermöglicht es (wie auch andere Strukturierungsverfahren) verschiedene Textteile zu unterscheiden. Es ermöglicht es aber auch - über die Attribute - Daten, die eingentlich nicht zum Inhalt eines Textes gehören, in einem Dokument abzulegen. Das können z. B. bibliographische Daten sein oder auch inhaltbeschreibende Daten wie eine Stichwortliste oder Klassifikation. Solche Daten bezeichnet man als Metadaten, also Daten über das eigentliche Dokument. Metadaten müssen allerdings nicht in dem Dokument abgelegt werden, das sie beschreiben. Auch die Einträge in einer Literaturdatenbank können als Metadaten betrachtet werden: sie enthalten Daten über das beschriebene Dokument. Typische Metadaten sind bibliographische Angaben zu Büchern und Zeitschriften. Hier steht die systematische formale Erfassung im Vordergrund. (Sie finden sich häufig auch in den Büchern selbst z. B. als "Library of Congress Cataloging-in-Publication Data" abgedruckt.) Durch die lange Tradition von Archiven und Bibliotheken gibt es insbesondere für wissenschaftlichen Artikel und Bücher eine Vielzahl von bibliographischen Formaten. Sie sind allerdings für digitale Objekte oder Dokumente nicht unbedingt geeignet.

ZUGANG4.7.1: Dublin Core

ZUGANG4.7.2: Warwick Framework

Durch die Einführung solcher Standards wie Dublin Core soll eine zumindest formal vereinheitlichte Beschreibung (wissenschaftlicher) Dokumente im Internet ermöglicht werden. Zur Zeit gibt es Bemühungen Dublin Core in den RDF-Standard (Resource Description Framework), der von einer Arbeitsgruppe des World Wide Web Consortium entwickelt wird, zu integrieren. Ziel solcher Bemühungen ist es, weltweit Dokumente zu bestimmten Themen suchen und austauschen zu können.

Ein anderer Ansatz, mit dem Web Dokumente mit Metadaten ausgezeichnet werden können ist PICS ( Platform for Internet Content Selection, www.w3.org/PICS/). Dieser Standard wurde zunächst vor allem entwickelt, um Seiten im Web zu kennzeichnen, deren Inhalt als nicht für Kinder und Jugendliche geeignet eingeschätzt wurde. Er ermöglicht aber als standardisierte Plattform prinzipiell beliebige Kennzeichnungschema einzusetzen.

Man unterscheidet dabei zwischen " self - rating" bei dem die Anbieter ihre eigenen Inhalte einschätzen und kennzeichnen und " third-party-rating" bei dem (eventuell auch mehrere) Agenturen oder Organisationen Angebote im Web beurteilen und kennzeichen. Das Ziel der Kennzeichnung ist mit einem entsprechenden Filter bei den Endnutzenden oder auch bei einem Zugangspunkt zum Web Angebote blockieren zu können, die z. B. als jugendgefährdend gekennzeichnet sind (negativ Auswahl), oder aber auch nur solche Angebote weiterzuleiten bzw. anzuzeigen, die - eventuell von einer bestimmten Organisation - als nicht jugendgefährdend eingestuft sind (positiv Auswahl).

Die Verfechter dieses Ansatzes sind der Überzeugung, dass eine offene Plattform für Kennzeichnungen, die den Nutzenden (bzw. deren Eltern) die Möglichkeit gibt, am eingenen Rechner eine Auswahl der anzeigbaren Angebote zu treffen, am besten dazu geeignet ist, die Vielfalt der Angebote im Web zu sichern.


ZURÜCK

© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber