4.7.1: Dublin Core
Als ersten Schritt hin zur einheitlichen Beschreibung
von digitalen Objekten durch Metadaten hat man sich zunächst
auf sogenannte
Document Like
Objects (
DLO)
beschränkt. Ein DLO steht für die
digitale Form dessen, was man bisher als Dokument kannte.
Es wird aber (ganz bewusst) nicht genauer definiert.
Überlegungen zur Entwicklung eines
Metadatenformats für DLO gehen auf einen
Workshop zurück, der 1995
in Dublin, Ohio stattfand (Weibel, Godby, Miller, Daniel
1996 [->]), um
über Wege zur Beschreibung von Objekten im Internet
nachzudenken. Nach diesem Ort ist eine
Sammlung von Metadatenelementen
als
Dublin
Core benannt worden, die - wie
der Name sagt - einen Kern von Angaben bilden soll,
mit dem ein DLO beschrieben werden kann. Ziel der Überlegungen war es, eine
Menge von einfachen Elementen zu
definieren, deren Namen möglichst intuitiv sind oder
durch kurze Definitionen erläutert werden können.
Dahinter stand die
Überlegung, dass die große
Mehrzahl der Webdokumente nicht von Expertinnen und Experten beschrieben werden
können, sondern dass die Metadaten
durch die Autorinnnen und Autoren zur
Verfügung gestellt werden müssen.
Die folgenden Elemente sind in Dublin Core vorgesehen:
-
Title: Namen des Objekts
-
Creator: Personen, die in erster
Linie für den Inhalt des Objekts verantwortlich sind z. B.
Autorinnen oder Autoren
-
Subject: Thema (Topic) des Objekts,
typischerweise Stichwörter, Deskriptoren oder Elemente eines
Klassifikationssystems.
-
Description Eine Beschreibung des
Objekts als Text. Bei Textdokumenten z. B. ein Abstract.
-
Publisher: Person(en) oder
Institutionen, die dafür verantwortlich sind, das Objekt
zugänglich zu machen.
-
Contributor: Personen oder
Organistionen, die wesentliche intellektuelle Beiträge zu dem Werk
geleistet haben aber nicht unter Creator genannt sind (Herausgebende,
Übersetzerinnen, Illustratoren)
-
Date:
Veröffentlichungsdatum
-
Type: Art des Objektes (z. B.
Erzählung, Gedicht oder Lexikon)
-
Format: Ein Datenformat (wie
PostScript, oder auch ausführbares Window's Programm)
-
Identifier: Zeichenkette oder
Nummer, mit der das Objekt eindeutig identifiziert werden kann (URL,
URN, ISBN).
-
Source: Informationen über
Objekte, aus denen das zu beschreibende Objekt abgeleitet wurde.
-
Language: Sprache des Inhalts des
Objects.
-
Relation: Beziehung zu anderen
Objekten
-
Coverage: räumliche und
zeitliche Charakteristika des Objekts
-
Rights Informationen über die
Rechte an dem Objekt (Urheber, Verwertungsrechte) bzw. die Instiutuion
die diese Rechte hält.
(Eine genauere Beschreibung findet sich in Weibel, Godby,
Miller, Daniel 1996 [->], bzw. der Dublin
Core Webseite http://purl.oclc.org/metadata/dublin_core/) Man sieht,
dass sich viele der Elemente an bibliographischen Daten für
"Papierdokumente" orientieren, wobei die möglichen
Einträge für digitale Dokumente angepasst sind (Format, Identifier).
Neben der Benennung der Elemente wurde noch eine Reihe
von Eigenschaften der Elemente bzw. Prinzipien ihres
Auftretens in einem Datensatz mit Metadaten
festgelegt:
- Dublin Core Elemente beschreiben
intrinsische
Eingenschaften von Objekten, also Eigenschaften des Objektes selbst.
Dieses Prinzip wurde allerdings nicht vollständig
durchgehalten.
-
Erweiterbarkeit der Elementsammlung. Weitere
Elemente müssen nicht von allen Systemen, die mit
Dublin Core arbeiten, verstanden werden. Die
Systeme müssen die Existenz unbekannter Elemente aber
tolerieren.
- Unabhängigkeit von einer spezifischen Syntax:
Hier war die Überlegung vor allem, dass es im damaligen Zeitpunkt
noch zu früh war, eine spezielle Syntax festzulegen. Inzwischen
gibt es diverse Arbeitsgruppen innerhalb der Dublin Core Initiative, die
sich mit syntaktischen Formaten der einzelnen Elemente
beschäftigen. Eine der ersten Gruppen, die Vorschläge
vorgelegt hat, war die Gruppe, die die Syntax des "Date"
Elements behandelte.
-
Optionalität: Dublin Core Elemente
können benutzt werden, sie müssen es aber nicht.
Es gibt keine vorgeschriebenen Tags, die angegeben werden
müssen. Das hat zwei Gründe: Für neuartige Objekte können
manche Elemente, die jetzt noch sehr zwingend
erscheinen, wenig winnvoll sein (ein Satelitenfoto hat gemeinhin keinen
Autor bzw. Creator). Man soll Autorinnen und Autoren nicht durch
komplexe Vorschriften abschrecken. Eine kurze Beschreibung ist besser
als gar keine.
-
Wiederholbarkeit: Alle Tags können
mehrmals in einem Datensatz auftreten. So können mehrere Autorinnen
aufgeführt werden, oder Sammlungen von Objekten beschrieben
werden.
-
Veränderbarkeit: Jedes Element kann
durch die Angabe eines Attributs verändert werden, d.
h. es kann dadurch eine neue / spezifische Interpretation des Inhalts
vorgegeben werden. Dadurch können z. B.
in einem Gebiet bewährte Inhaltsklassifikationen in
Dublin Core übernommen werden. Dazu wird der Name des
Klassifikationsschemas angegeben.
Durch diese Prinzipien soll Dublin Core klein und flexibel gehalten
werden. Gleichzeitig soll es möglich sein, vorhandene
Metadatenschemata zu integrieren. Dublin Core hätte damit eine Integrationsfunktion
für verschiedene Auszeichnungs- und Metadatenschemata.
Ein DTD - Entwurf für Dublin Core Metadaten
findet sich ebenfalls in Weibel, Godby, Miller, Daniel 1996 [->]. Dort werden
über Entities zulässige Schemata (bzw.
other
) festgelegt und dann Elemente definiert,
über deren Attributliste diese Schemata den Daten, die in den
Elementen stehen, zugeordnet werden. (Siehe Abbildung
65
). Dieser Entwurf gibt allerdings nicht unbedingt den
aktuellen Stand der Diskussion wider.
Durch eine solche DTD können Metadaten
strukturiert werden. Sie bilden den Inhalt des Dokuments, das durch die
DTD definiert wird, so wie die Einträge einer Literaturdatenbank
auch als strukturierte Dokumente aufgefasst werden können.
In anderen Fällen brauchen oder sollen aber die Metadaten
nicht nach aussen sichtbar sein. In diesen Fällen könnte man
sie als Attributwerte ablegen, wie es z. B. in HTML für
Inhaltsbeschreibung und Stichworte mit einem META Tag getan wird.
Nach dem ersten Workshop in Dublin (Ohio)
haben weitere Workshops stattgefunden, die
sich mit spezifischen
Problemen bei der Entwicklung des Formats befasst haben.
Dabei hat sich gezeigt, dass die
Ansichten über einige der oben
aufgeführten Prinzipien durchaus auseinander gehen.
Insbesondere bei der Frage, wie weit genaue Formate und
ausgearbeitete Strukturen bei den einzelnen Elementen vorgegeben werden
sollen, gibt es zwei Positionen: Während die einen vor allem
die einfache Anwendbarkeit betonen und
deshalb keine komplexen Strukturen einführen wollen, sehen die
anderen die Notwendigkeit durch genauere Vorgaben den Nutzen
der Beschreibungen zu erhöhen. Insbesondere sollen vorhandene
Standards genutzt werden, und nicht hinter sie zurückgefallen
werden.
© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber