Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Explizit strukturierte Dokumente -> XML
Stichwörter dieser Seite SGML, W3C, Skalenniveau, Namensraum, namespace, Modularität, Vererbung
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.1.3.2: XML Schema

Mit XML Schema soll eine Beschreibungssprache entwickelt werden, mit der Datentypen genauer definiert werden können als es in einer SGML DTD möglich ist. Unter anderen nennt der W3C-Vorschlag für eine XML-Schema-Datentypen-Beschreibungssprache vom 30. März 2001 [->] folgende Anforderungen:

  • Definition von primitiven Datentypen wie Bytes, Zahlen, Daten, Aufzählung, aber auch SQL- und Java-Datentypen
  • die Möglichkeit, anwendungsspezifische Datentypen zu definieren, die z.B. bezüglich ihrer Genauigkeit, ihres Definitionsbereichs, ihrer Länge oder ihres Formats genauer spezifiziert sind
  • Entwicklung eines Typsystems, das sich für den Datenaustausch zwischen Datenbanksystemen eignet.

Auf solchen genauer spezifizierten Datentypen können z.B. Vergleichsoperationen angewendet werden, die von den Datentypen abhängen, wie Vergleiche von Werten auf unterschiedlichen Skalenniveaus. Konkret können das Vergleiche von Zahlen, Zeiten (Datum) oder Kosten sein oder auch der Vergleich von Personennamen. Dadurch kann die Suche nach Dokumenten oder Datensätzen verbessert werden.

Durch die Möglichkeit, sie lokal für ein Dokument, eine Sammlung oder ein Informationssystem zu definieren, können Datentypen entwickelt werden, die an die Anforderungen des jeweiligen Objekts angepasst sind. Diese Datentypen sind dann allerdings zunächst nur für diese Anwendung gültig. Um die Gültigkeitsbereiche von Datentypdefinitionen genau zu beschreiben und deren Definitionen auch anderen Dokumenten oder Anwendungen zur Verfügung zu stellen, verwendet XML Namensräume (namespaces).

Auf einen Namensraum kann durch einen Ausdruck wie <xsd:schema xmlns:xsd = "http://www.w3.org/2001/XMLSchema"> Bezug genommen werden. Dabei gibt die HTTP-Adresse an, wo die Definition der Datentypen gefunden werden kann. Wenn sie benutzt werden, werden die Elemente aus dieser Definition mit dem durch einen Doppelpunkt abgesetzten "Präfix" versehen, das nach xmlns: steht (im obigen Beispiel also xsd:). Mit diesem Mechanismus lassen sich vorhandene Definitionen verwenden (wie im obigen Beispiel die allgemeine XML-Schema-Definition von 2001). Es können aber auch Definitionen aus mehreren Namensräumen gleichzeitig verwendet werden (Modularität) - auch um damit neue Datentypen zu definieren. Dabei sieht XML auch das Prinzip der Vererbung vor: Zu einem Datentyp können abgeleitete Datentypen definiert werden, indem zusätzliche Eigenschaften oder Einschränkungen spezifiziert werden.

Durch die Modularität von XML können einheitliche Definitionen für häufig vorkommende Objekte wiederverwendet werden; durch die Vererbung können Vergleichsverfahren, die sich auf die allgemeinen Teile eines Datentyps beziehen, auch für die abgeleiteten Datentypen verwendet werden. Durch beide Konzepte wird die Interoperabilität oder Vergleichbarkeit von Daten aus verschiedenen Sammlungen und Systemen erhöht. Die Entwicklung der Systeme und Sammlungen wird allerdings auch entsprechend komplizierter.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Explizit strukturierte Dokumente -> XML
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.1.3.2XML Schema
SGML, W3C, Skalenniveau, Namensraum, namespace, Modularität, Vererbung Modularität, Namensraum, namespace, SGML, Skalenniveau, Vererbung, W3C

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.