Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Erweiterte Retrieval-Ansätze -> Korpusbasierte Verfahren -> Kookurrenzverfahren
Stichwörter dieser Seite Attribut, assoziativer Thesaurus
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

3.5.2.8: Komplexere Kookurrenzverfahren

Andere Untersuchungen, die mit Kookurrenzdaten arbeiten, verwenden kompliziertere Attribute als nur das Auftreten von Termen in Dokumenten. Grefenstette (1992) [->] und Ruge (1992) [->] verwenden eine grobe syntaktische Analyse zur Bestimmung der Kookurrenz. Dabei werden nur Wörter in bestimmten syntaktischen Positionen berücksichtigt.

In einem ähnlichen Ansatz verwenden Jing und Croft (1994) [->] Satzteile ("phrases"), die einer bestimmten Regel genügen. Eine einfache Regel für einen Satzteil (noun-phrase) wäre z.B. {N,NN,NNN} . Sie besagt, dass ein einzelnes Hauptwort der Regel genügt oder auch zwei oder drei unmittelbar hintereinander stehende Hauptwörter (im Englischen entspricht diese Regel zum Teil der deutschen Kompositionsregel für Substantive: immigration officer = Grenzbeamter). Neben Substantiven können auch Adjektive in Regeln einbezogen werden. {JNN,JNNN} steht beispielsweise für ein Adjektiv, dem zwei oder drei Substantive folgen. Damit dieses Verfahren angewendet werden kann, muss für jedes Wort eines Texts bestimmt werden, ob es sich um eine der gesuchten Wortarten handelt.

Zwischen den Termen und Satzteilen, die in einem Satz gefunden werden, berechnet man Assoziationen, indem man die Häufigkeiten, mit denen sie auftreten, miteinander multipliziert. Diese Assoziationen werden zu einem assoziativen Thesaurus zusammengefasst.

In experimentellen Studien konnte gezeigt werden, dass sich Retrieval-Ergebnisse durch die Query-Expansion mit assoziativen Thesauren bei einigen Testkollektionen verbessern lassen. Bei anderen Kollektionen war das nicht der Fall (Jing und Croft, 1994 [->] ).

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Erweiterte Retrieval-Ansätze -> Korpusbasierte Verfahren -> Kookurrenzverfahren
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
3.5.2.8Komplexere Kookurrenzverfahren
Attribut, assoziativer Thesaurus assoziativer Thesaurus, Attribut

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.