ZURÜCK

6.1.1: Der assoziative Ansatz im IR

Die diesem Ansatz zugrundeliegende Assoziationstheorie lässt sich bereits bei Aristoteles finden. Der englische Psychologe William James formulierte sie 1890 folgendermaßen:

"objects once experienced together tend to become associated in the imagination, so that when any one of them is thought of, the others are likely to be thought of also"
(James, 1890, Band 1, Seite 561) [->]

Mit dieser einfachen Annahme kann man versuchen, aus großen Textkorpora Assoziationen zwischen Termen zu berechnen und sie zur Darstellung von Begriffen oder Konzepten zu verwenden, wie das bereits beim Imaging angenommen wurde: Dort wurden Terme durch die Dokumente charakterisiert, in denen sie auftraten.

Diese Methode kann auch als anderer und allgemeinerer Ansatz zu den Überlegungen aus Abschnitt _3.2.1_ zur Grundformenreduktion aufgefasst werden. Dort war zwischen einem Pattern Recognition Ansatz, der Terme als Zeichenketten behandelt, und einem computerlinguistischen Ansatz, der Terme als Formen eines Wortes ansieht, unterschieden worden. Im letzten Fall wird ein Wort als " Oberflächenform" eines Begriffs oder Konzepts aufgefasst. In diesem Zusammenhang waren bereits die Probleme der Synonymie und Polysemie angesprochen worden, also die Tatsache, dass zwei verschiedene Wörter das selbe Objekt bezeichnen können, bzw. dass ein Wort zwei verschiedene Objekte bezeichnen kann. Ersetzt man "Objekt" durch "Begriff" oder "Konzept" sieht man, dass dieses Problem viel allgemeiner besteht, dass einem Begriff nämlich häufig mehrere Wörter zugeordnet werden können, die ihn charakterisieren, bzw. ein Wort zur Charakterisierung von verschiedenen Begriffen verwendet werden kann.

Der assoziative Ansatz stellt eine einfache Modellierung dieser Beobachtung dar: er charakterisiert die "Bedeutung" eines Terms durch dessen Beziehungen zu anderen Termen, konkret durch eine Menge von Gewichten, die die Ähnlichkeiten zu den anderen Termen eines Vokabulars beschreiben. Angewandt auf das Information Retrieval, versucht der assoziative Ansatz durch ein Ähnlichkeitsmaß zwischen Termen, einer Indexierung oder einer Anfrage weitere Terme hinzuzufügen, die im Allgemeinen zur Charakterisierung eines Begriffes oder Konzepts verwendet werden, in dem Dokument bzw. der Anfrage aber nicht auftauchen.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber