Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Metadaten -> RDF und das Semantische Web
Stichwörter dieser Seite Semantisches Web, Semantic Web Initiative, W3C, XML, RDF, Aussage, Logikschicht, logic layer, Regel, Berechnungsschicht, proof layer, Bewertungsschicht, trust layer, URI, Link, Regel, XML
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

4.2.4.2: Pläne für ein Semantisches Web

Die Entwicklung von RDF-Schema ist Teil der Semantic Web Initiative des W3C, die sich zum Ziel gesetzt hat, Beschreibungsstandards und Technologien zu entwickeln, mit denen im Web nicht nur die Suche nach Informationen und Dokumenten verbessert werden kann, sondern auch die automatische Verarbeitung von Daten und Wissen aus unterschiedlichen Quellen unterstützt wird. Dadurch sollen automatisierte Dienste in den unterschiedlichsten Bereichen wie digitale Bibliotheken, E-Business und Gesundheitsdienstleistungen angeboten werden können. Dazu soll auf den vorhandenen bzw. zurzeit entwickelten XML- und RDF-Anwendungen aufgebaut werden. Zusätzlich soll mit Verschlüsselung und digitaler Signatur bzw. sicherer Identifizierung die Verlässlichkeit der Kommunikation im Web erhöht werden.

Für die Entwicklung dieses "Semantischen Web" (Semantic Web) geht die Initiative von einem Schichtenmodell aus, dessen Grundlage der URI (Uniform Resource Identifier) zur Benennung von (Web-)Objekten und die Verwendung von Unicode als sprachen- und schriftenübergreifende Kodierung bilden. Darauf setzten als nächste Schicht XML, XML Schema und das Namensraumkonzept von XML auf, mit denen Dokumente und Datensätze formatiert werden können. Über dieser Schicht liegt mit RDF und RDF-Schema die Schicht, in der Aussagen über (Web-)Objekte formuliert und Typinformationen über Objekte und ihre Beziehungen untereinander beschrieben werden können. Bis zu dieser Schicht wird im Wesentlichen ein Datenkonzept aufgebaut, mit dem die Beschreibung und Bearbeitung von Inhalten ermöglicht werden soll. Der erste Schritt dazu soll in einer Vokabular- und Ontologieschicht getan werden, in der Inhaltskonzepte und Beziehungen zwischen diesen Konzepten entwickelt werden sollen.

Für das Semantische Web sind noch drei weitere Schichten geplant: In einer Logikschicht (logic layer) sollen Regeln zur Verarbeitung der in der Ontologieschicht beschriebenen Inhalte definiert werden, die dann in der darüber liegenden Berechnungsschicht (proof layer) ausgeführt werden. Als letzte Schicht ist schließlich eine Bewertungsschicht (trust layer) vorgesehen, in der entschieden werden soll, ob die Ergebnisse vertauenswürdig genug sind, um angewendet zu werden.

Für die Entwicklung formuliert die W3C-Initiative eine Reihe von Prinzipien (Koivunen und Miller, 2001 [->] ), die natürlich auf dem Schichtenmodell und anderen Aktivitäten des W3C aufbauen und vieles von dem widerspiegeln, was bereits an anderer Stelle eingeführt oder erwähnt wurde:

  • Alles kann durch einen URI (Uniform Resource Identifier) identifiziert werden: Für physische Objekte wie Personen oder Orte kann das auch durch Beschreibungen im Web oder die E-Mail-Adresse geschehen.
  • Objekte und Verweise (Links) können einen Typ haben.
  • Unvollständige und Teilinformationen müssen toleriert werden: Das heißt, dass Anwendungen im "Semantic Web" auch funktionieren müssen, wenn nur unvollständige Informationen vorliegen, Links nicht funktionieren oder Seiten sich geändert haben.
  • Es muss auch ohne die "absolute Wahrheit" gehen: Das Web ist auch jetzt ein offenes System, in dem im Prinzip jede und jeder Dokumente veröffentlichen kann. Einige Server sind dabei vertrauenswürdiger als andere, es gibt verschlüsselte Übertragung und vereinzelt auch digitale Signaturen. Auch heute liegt die Entscheidung, welcher Quelle oder welchem Server man vertraut, bei den Nutzenden oder den jeweiligen Anwendungen. Auch das Semantische Web wird selbst keine Garantien auf Vertrauenswürdigkeit der Quellen und Richtigkeit der Informationen geben können. Das bleibt nach wie vor die Angelegenheit der Anwendungen und Nutzenden.
  • Weiterentwicklungen sollen unterstützt werden: Das Semantische Web nutzt beschreibende Konventionen und Regeln, die weiterentwickelt und an die Bedürfnisse einzelner Gruppen angepasst werden können. So können existierende Daten später durch zusätzliche Attribute in den Kontext gestellt werden, in dem sie gültig waren, oder es können Erweiterungen und Ergänzungen vorgenommen werden, ohne die Daten selbst zu ändern.
  • So wenig Festlegungen wie möglich: Dadurch, dass unnötige Spezifikationen und Festlegungen vermieden werden, werden einfache Anwendungen nicht behindert, und auch für komplexe Anwendungen bleibt der notwendige Raum für Entwicklungen.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 101: Ein RDF-Graph, mit dem die Eigenschaft eg:author definiert wird

Betrachtet man die Entwicklung der Forschung zur künstlichen Intelligenz, die Entwicklung des Web (siehe Abschnitt 4.3.1 ) und die (kurze) Geschichte von XML, scheinen die Pläne zum Semantischen Web recht ambitioniert. In allen Fällen hat sich gezeigt, dass die Entwicklungen, solange sie sich im technischen, d.h. syntaktischen Bereich bewegt haben, durchaus erfolgreich waren. Expertensysteme, die mit streng formatierten und wohl definierten Daten arbeiten, wie die anfangs beschriebenen Fahrplan-Auskunftssysteme, sind erfolgreich; der Erfolg von HTML und HTTP zum Layout und Verknüpfen von Web-Seiten ist unbestritten, und XML bewährt sich als Austauschformat zwischen Datenbanken und anderen Anwendungssystemen nicht nur im Web.

Sobald es aber darum geht, menschliche Informationsverarbeitung mit automatischen Systemen zu simulieren oder auch nur darum, Informationen zwischen Maschinen und Menschen auszutauschen, werden die Erfolge erheblich seltener. Viele der hochtrabenden Pläne, die zu diesen Fragen in den letzten 40 Jahren gemacht wurden, mussten immer wieder verschoben und relativiert werden. Wo sie erfolgreich waren, lag das oft eher an der Anpassung der Menschen an die Maschinen als umgekehrt an der Anpassung der Maschinen an die Menschen. Die Ausgangslage für das Semantische Web als weltweites, dezentrales und dynamisches Medium, in dem auch noch viele kommerzielle und politische Interessen die Entwicklung beeinflussen, ist sicherlich nicht sonderlich günstig, um diesmal erfolgreicher zu sein.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Information Retrieval und das Web -> Metadaten -> RDF und das Semantische Web
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
4.2.4.2Pläne für ein Semantisches Web
Abb. 101 Ein RDF-Graph, mit dem die Eigenschaft eg:author definiert wird
Semantisches Web, Semantic Web Initiative, W3C, XML, RDF, Aussage, Logikschicht, logic layer, Regel, Berechnungsschicht, proof layer, Bewertungsschicht, trust layer, URI, Link, Regel, XML Aussage, Berechnungsschicht, Bewertungsschicht, Link, logic layer, Logikschicht, proof layer, RDF, Regel, Regel, Semantic Web Initiative, Semantisches Web, trust layer, URI, W3C, XML, XML

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 13-05-2004 erzeugt.