Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web
Stichwörter dieser Seite Metadaten, XML, Stichwort, Klassifikation
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.2: Metadaten

Im vorigen Kapitel wurde beschrieben, wie die Struktur von Dokumenten bei der Suche verwendet werden kann. Ein anderer Ansatz, die Suche zu verbessern, besteht darin, zusätzliches Wissen zu nutzen, das über die Dokumente existiert. Das geschieht auch, wenn Literaturdatenbanken oder Kataloge verwendet werden. Diese Hilfsmittel sind aber zugleich zentralisierte Verweise auf die Dokumente einer Sammlung, mit denen der Zugriff organisiert wird, indem z.B. ein Standort in einer Bibliothek oder die genauen Veröffentlichungsdaten angegeben werden.

Bei der automatischen Verarbeitung von Dokumenten (oder allgemeiner: digitalen Objekten) kann dieser Zugriff gut über Programme organisiert werden, wenn die Objekte in einer Form beschrieben sind, die von Rechnern verarbeitet werden kann. Wenn solche Beschreibungen auch Daten über die Qualität, die Art der Veröffentlichung und die Zugriffsmöglichkeiten enthalten, können auch Dokumente, die nicht in einer extra aufgebauten und gepflegten Sammlung enthalten sind, gefunden werden. Daher ist es für digitale Objekte wichtiger, dass gute maschinenlesbare Beschreibungen existieren und gefunden werden können, als dass sie bereits als Kataloge organisiert sind. Solche Beschreibungen von Objekten bezeichnet man als Metadaten, also Daten über das eigentliche Dokument.

Mit SGML, XML und anderen Strukturierungsverfahren können verschiedene Textteile unterschieden werden. So können auch Metadaten, die ja eigentlich nicht zum Inhalt eines Textes gehören, in einem Dokument abgelegt werden, wie z.B. die Daten im Head-Element eines HTML-Dokuments. Durch die lange Tradition von Archiven und Bibliotheken gibt es insbesondere für wissenschaftliche Artikel und Bücher eine Vielzahl von bibliografischen Formaten, die Metadaten beschreiben. Dabei steht die formale Erfassung bibliografischer Daten im Vordergrund. Sie enthalten aber auch Daten, die den Inhalt beschreiben, wie Stichwortlisten oder Klassifikationen. Solche Daten werden übrigens auch bei gedruckten Büchern häufig in den Büchern selbst abgedruckt, z.B. als Library of Congress Cataloging-in-Publication Data. Die klassischen Bibliotheksformate sind allerdings für digitale Objekte oder Dokumente nicht unbedingt geeignet.

Pfeil als Kennzeichnung einer Unterueberschrift 4.2.1: Dublin-Core-Metadaten

Pfeil als Kennzeichnung einer Unterueberschrift 4.2.2: Hierarchisch strukturierte Metadaten

Pfeil als Kennzeichnung einer Unterueberschrift 4.2.3: PICS

Pfeil als Kennzeichnung einer Unterueberschrift 4.2.4: RDF und das Semantische Web

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.2Metadaten
4.2.1Dublin-Core-Metadaten
4.2.2Hierarchisch strukturierte Metadaten
Abb. 98 Die neun Top-Level-Elemente der LOM-Spezifikation
Abb. 99 Ein Zweig der LOM-Spezifikation
4.2.3PICS
4.2.4RDF und das Semantische Web
4.2.4.1Resource Description Framework
Abb. 100 Dublin-Core-Beschreibung eines Artikels mit dem Resource Description Framework (RDF)
4.2.4.2Pläne für ein Semantisches Web
Abb. 101 Ein RDF-Graph, mit dem die Eigenschaft eg:author definiert wird
Metadaten, XML, Stichwort, Klassifikation, Metadaten, Document Like Objects, DLO, Dublin Core, Dublin Core Metadata Initiative, DCMI, Stichwort, Abstract, Relation, internationalization, localization, Interoperabilität, unqualified Dublin Core, qualified Dublin Core, Spezialisierung, Refinement, encoding scheme, Refinement, Alternative, Table of Contents, Abstract, Created, Valid, Available, Issued, Modified, Extent, Medium, Relation, Is Version Of, Has Version, Is Replaced By, Replaces, Is Required By, Requires, Is Part Of, Has Part, Is Referenced By, References, Is Format Of, Has Format, Spatial, Temporal, LCSH, MeSH, DDC, LCC, UDC, DCMI Period, W3C-DTF, DCMI Type Vocabulary, IMT, URI, ISO 639-2, RFC 1766, Relation, URI, DCMI Point, ISO 3166, DCMI Box, TGN, DCMI Period, W3C-DTF, Attribut-Wert-Paar, Namensraum, RDF, Document Like Objects, Metadaten, Learning-Object-Metadata, LOM, XML-Binding, IMS - Global Learning Consortium, computergestütztes Lernen, CBT, Computer Based Training, Blattelement, Ordinalskala, Rationalskala, Nominalskala, Ähnlichkeitsfunktion, Transliteration, Synonymmenge, Ähnlichkeitssuche, elementare Anfrage, Nominalskala, Skalenniveau, XML, Faktendatenbank, Metadaten, PICS, Platform for Internet Content Selection, Negativauswahl, Positivauswahl, Selbstbeurteilung, self-rating, Beurteilung durch Dritte, third-party-rating, Provider, Metadaten, W3C, Resource Description Framework, RDF, Ressource, XML, Objekt, resources, URI, Uniform Resource Identifier, Eigenschaften, properties, Aussage, statement, Subjekt, Prädikat, Objekt, Beschreibung, description, Container, Bag, Sequence, Alternative, Attribut-Wert-Paar, Dublin Core, RDF-Graph, Dublin Core, RDF Vocabulary Description Language, RDF Schema, Aussage, RDF-Klassen, Literal, Container, class, Wertebereich, SubClassOf, SubPropertyOf, Spezialisierung, Klassifikation, Semantisches Web, Semantic Web Initiative, W3C, XML, RDF, Aussage, Logikschicht, logic layer, Regel, Berechnungsschicht, proof layer, Bewertungsschicht, trust layer, URI, Link, Regel, XML Abstract, Abstract, Ähnlichkeitsfunktion, Ähnlichkeitssuche, Alternative, Alternative, Attribut-Wert-Paar, Attribut-Wert-Paar, Aussage, Aussage, Aussage, Available, Bag, Berechnungsschicht, Beschreibung, Beurteilung durch Dritte, Bewertungsschicht, Blattelement, CBT, class, Computer Based Training, computergestütztes Lernen, Container, Container, Created, DCMI, DCMI Box, DCMI Period, DCMI Period, DCMI Point, DCMI Type Vocabulary, DDC, description, DLO, Document Like Objects, Document Like Objects, Dublin Core, Dublin Core, Dublin Core, Dublin Core Metadata Initiative, Eigenschaften, elementare Anfrage, encoding scheme, Extent, Faktendatenbank, Has Format, Has Part, Has Version, IMS - Global Learning Consortium, IMT, internationalization, Interoperabilität, Is Format Of, Is Part Of, Is Referenced By, Is Replaced By, Is Required By, Is Version Of, ISO 3166, ISO 639-2, Issued, Klassifikation, Klassifikation, LCC, LCSH, Learning-Object-Metadata, Link, Literal, localization, logic layer, Logikschicht, LOM, Medium, MeSH, Metadaten, Metadaten, Metadaten, Metadaten, Metadaten, Modified, Namensraum, Negativauswahl, Nominalskala, Nominalskala, Objekt, Objekt, Ordinalskala, PICS, Platform for Internet Content Selection, Positivauswahl, Prädikat, proof layer, properties, Provider, qualified Dublin Core, Rationalskala, RDF, RDF, RDF, RDF Schema, RDF Vocabulary Description Language, RDF-Graph, RDF-Klassen, References, Refinement, Refinement, Regel, Regel, Relation, Relation, Relation, Replaces, Requires, Resource Description Framework, resources, Ressource, RFC 1766, Selbstbeurteilung, self-rating, Semantic Web Initiative, Semantisches Web, Sequence, Skalenniveau, Spatial, Spezialisierung, Spezialisierung, statement, Stichwort, Stichwort, SubClassOf, Subjekt, SubPropertyOf, Synonymmenge, Table of Contents, Temporal, TGN, third-party-rating, Transliteration, trust layer, UDC, Uniform Resource Identifier, unqualified Dublin Core, URI, URI, URI, URI, Valid, W3C, W3C, W3C-DTF, W3C-DTF, Wertebereich, XML, XML, XML, XML, XML, XML-Binding

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.