Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren
Stichwörter dieser Seite Relation, semantisches Netz, Frame, Synonymmenge, Ontologie, Konsistenz, Teilmengenbeziehung, Element-Beziehung, Teil-Ganzes-Beziehung, Klassifikation, Spezialisierung
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.3.5: Semantische Netze

Bei der Beschreibung der Relationen zwischen Thesaurustermen wurde allgemein von Oberbegriffen und von spezifischeren Begriffen gesprochen. Dabei wurde nicht genauer spezifiziert, wie diese Relationen bestimmt werden sollen. Im Information Retrieval werden die Relationen genutzt, um eine Anfrage durch Oberbegriffe allgemeiner oder durch spezifischere Begriffe spezifischer zu machen. Für diesen Zweck ist eine wenig genau definierte Relation meistens ausreichend. Bei anderen Anwendungen ist das nicht immer der Fall.

Es gibt viele Ansätze, die zur Modellierung von Wissen Repräsentationen verwenden, in denen Begriffe oder Konzepte durch Relationen verbunden sind. So ist in der Forschung zur künstlichen Intelligenz versucht worden, Wissen durch semantische Netze oder auch durch Frames zu modellieren. Eines der bekannteren semantischen Netze ist WordNet, ein seit 1985 in Princeton entwickeltes System von Synonymmengen, die mit Relationen verknüpft sind ([->] ; Fellbaum 1998 [->] ). Unterdessen gibt es auch parallele Projekte in anderen Sprachen als Englisch.

In semantischen Netzen können Relationen nicht nur dazu verwendet werden, Deskriptoren in einer Anfrage zu ersetzen oder weitere Deskriptoren zu einer Anfrage hinzuzufügen, sondern es können aufgrund der Relationen logische Schlüsse gezogen werden. So lassen sich z.B. durch Vererbungsmechanismen Eigenschaften eines Konzepts auf dessen Unterkonzepte übertragen.

Man kann versuchen, solche Methoden auch im Information Retrieval einzusetzen, um ein Wissensgebiet zu strukturieren, zu modellieren und Objekte aus dem Gebiet zugänglich zu machen. Solche Systeme werden häufig als Ontologien bezeichnet, wobei die Meinungen darüber, ob das eine sinnvolle Bezeichnung ist, auseinander gehen. In der deutschen Bedeutung ("Lehre vom Sein", Wahrig, 1977 [->] ) ist der Begriff sicherlich ein paar Nummern zu groß für die damit beschriebenen Mechanismen.

Wenn Relationen zur komplexeren Wissensverarbeitung - also z.B. zum logischen Schließen - verwendet werden, müssen in der Regel strengere Anforderungen an ihre Konsistenz gestellt werden, um sinnvolle Ergebnisse zu erzielen. Das bedeutet insbesondere, dass die Relationen genauer definiert und beschrieben werden müssen, um Widersprüche zu vermeiden.

Die Allgemeiner-Spezifischer-Relation kann man auf verschiedene Weise präzisieren, z.B. als:

  • Teilmengenbeziehung: Jedes Element der durch den spezifischeren Begriff beschriebenen Menge ist auch Element der durch den allgemeineren Begriff beschriebenen Menge: Ein Laubbaum ist ein spezifischeres Konzept als ein Baum, weil jeder Laubbaum ein Baum ist. Diese Beziehung kann insbesondere über die Beschreibung von Konzepten durch Merkmale zustande kommen: Indem ein zusätzliches Merkmal spezifiziert wird (hat irgendwann mal Blätter), wird ein Unterkonzept beschrieben.
  • Element-Beziehung: Der spezifischere Begriff bezeichnet ein Exemplar aus dem allgemeineren Konzept: Die Scheftheimer Eiche ist ein Laubbaum.
  • Teil-Ganzes-Beziehung: Das spezifischere Konzept ist ein (physischer) Teil des allgemeineren Konzepts: Ein Ast ist ein Teil eines Baums.
Diese Beispiele zeigen die Analogie zur hierarchischen Klassifikation: Während bei der Klassifikation die Art der Spezialisierung im Prinzip für die ganze Hierarchie vorgegeben wird, ist es bei den semantischen Netzen möglich, verschiedene Arten der Spezialisierung in einem System zu berücksichtigen. Dadurch wird das System mächtiger, allerdings auch wesentlich komplizierter. Als Ansätze zu einer solchen Typisierung von Beziehungen zwischen Klassen können auch die Anhängezahlen bei Klassifikationen gesehen werden: Sie können ebenfalls spezifische Verbindungen zwischen Klassen darstellen, mit denen allerdings Verfeinerungen der Konzepte beschrieben, nicht aber Relationen definiert werden, auf denen Operationen wie Vererbung etc. durchgeführt werden.

Die Beispiele zeigen auch, dass unter verschiedenen Gesichtspunkten bzw. durch verschiedene Relationen ganz unterschiedliche Hierarchisierungen möglich sind. So kann man z.B. argumentieren, dass unter der Teil-Ganzes-Beziehung ein Baum ein Teilkonzept des Waldes ist. Andersherum kann man über die Merkmalsbeschreibung z.B. das Konzept Baum als "Pflanze mit einem verholzten Stamm" beschreiben. Wald könnte dann als spezifischeres Konzept definiert werden, bei dem zusätzlich gefordert wird, dass mehrere Exemplare in einer geschlossenen Gruppe stehen. Je nach Sichtweise kann sich also eine genau gegensätzliche Allgemeiner-Spezifischer-Relation ergeben. Das verweist mal wieder auf das allgemeine Problem, dass zwischen den formal definierten Konzepten und ihrer umgangssprachlichen Bedeutung eine Verbindung hergestellt werden muss, sobald ein System den Anspruch erhebt, einen Teil der Alltagswelt und ihrer sprachlichen Beschreibung abzubilden. Umgekehrt kann man daraus schließen, dass deduktive Logik nicht immer ein überzeugendes Konzept ist, um menschliche Informationsverarbeitung zu simulieren. Zumindest benötigt sie sehr viel zusätzliches Hintergrundwissen, wenn Alltagssprache verarbeitet werden soll, wie die Auflösung der Referenz von "es" im Beispiel in Abbildung 28 zeigt.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 28: Dereferenzierung eines Pronomens

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.3.5Semantische Netze
Abb. 28 Dereferenzierung eines Pronomens
Relation, semantisches Netz, Frame, Synonymmenge, Ontologie, Konsistenz, Teilmengenbeziehung, Element-Beziehung, Teil-Ganzes-Beziehung, Klassifikation, Spezialisierung Element-Beziehung, Frame, Klassifikation, Konsistenz, Ontologie, Relation, semantisches Netz, Spezialisierung, Synonymmenge, Teil-Ganzes-Beziehung, Teilmengenbeziehung

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.