Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Explizit strukturierte Dokumente
Stichwörter dieser Seite XML, Extended Markup Language, XSL, Extensible Stylesheet Language, Erweiterbarkeit, World Wide Web Consortium, W3C
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.1.3: XML

Um Beschränkungen, die mit der HTML DTD einhergehen, zu überwinden, wird vom World Wide Web Consortium XML (Extended Markup Language) entwickelt. XML ist einerseits ein "Anwendungsprofil" bzw. eine eingeschränkte Version von SGML, die spezifisch für verteilte Systeme, also vor allem das Internet, entwickelt wurde. Andererseits wird damit häufig auch eine ganze Familie von Spezifikationen, Formaten und Technologien bezeichnet, die auf XML aufbauen und ständig weiter entwickelt werden.

XML stellt zwar auch eine Grundmenge von Elementen zur Verfügung, es können darüber hinaus aber auch eigene Elemente definiert werden. So können für bestimmte Gebiete oder Anwendungsgruppen spezifische Elemente in Form von (Teil-)DTDs geschrieben werden, ohne dass sie gleich in die allgemeine HTML DTD aufgenommen werden müssen. Im Prinzip können aber auch für ein einziges Dokument neue Elemente durch eine DTD eingeführt werden.

Mit XML wurde auch ein neuer Anlauf genommen, die logische Struktur und das Layout von Dokumenten zu trennen. Während XML die logische Struktur beschreibt, wird die Darstellung der Elemente bzw. eines Dokuments, das sich aus Elementen zusammensetzt, über Stylesheets festgelegt, die mit XSL, der Extensible Stylesheet Language, beschrieben werden.

Neben der oben beschriebenen Erweiterbarkeit der DTD, also den logischen Strukturen, mit denen Dokumente oder auch Datensätze beschrieben werden können, werden mit XML eine ganze Reihe weiterer Konzepte zur Verfügung gestellt bzw. entwickelt, die die Ausdrucksfähigkeit von Web-Dokumenten und vor allem deren maschinelle Verarbeitung verbessern sollen. Diese Konzepte eröffnen neue Möglichkeiten, sie verkomplizieren gleichzeitig aber die Erstellung von Web-Angeboten und entfernen sich damit von einer der Eigenschaften von HTML, die ganz wesentlich zum Erfolg des Web beigetragen hat: der einfachen Erstellung von Web-Seiten.

Im Folgenden sollen einige der Konzepte kurz dargestellt werden. Die Spezifikationen und genauere Beschreibungen finden sich auf den Web-Seiten des World Wide Web Consortium (W3C) [->] .

Pfeil als Kennzeichnung einer Unterueberschrift 4.1.3.1: Verweise: XPointer und XLink

Pfeil als Kennzeichnung einer Unterueberschrift 4.1.3.2: XML Schema

Pfeil als Kennzeichnung einer Unterueberschrift 4.1.3.3: XPath, XQuery

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Explizit strukturierte Dokumente
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.1.3XML
4.1.3.1Verweise: XPointer und XLink
4.1.3.2XML Schema
4.1.3.3XPath, XQuery
XML, Extended Markup Language, XSL, Extensible Stylesheet Language, Erweiterbarkeit, World Wide Web Consortium, W3C, Link, XPointer, XLink, SGML, W3C, Skalenniveau, Namensraum, namespace, Modularität, Vererbung, XPath, XML Path Language, XSLT, XSL Transformations, XML Query Language, XQL, Fakten-Retrieval Erweiterbarkeit, Extended Markup Language, Extensible Stylesheet Language, Fakten-Retrieval, Link, Modularität, Namensraum, namespace, SGML, Skalenniveau, Vererbung, W3C, W3C, World Wide Web Consortium, XLink, XML, XML Path Language, XML Query Language, XPath, XPointer, XQL, XSL, XSL Transformations, XSLT

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.