Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Bewertung und Vergleich von IR-Systemen
Stichwörter dieser Seite Einflussfaktoren, input policies, Dokumentformat, physical input form, Indexierungsmethode, indexing language, kontrolliertes Vokabular, Indexierungsvorgang, indexing operation, search operation
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.3.7.1: Einflussfaktoren

Um einen Eindruck zu vermitteln, in wie vielen Aspekten sich IR-Systeme unterscheiden können, soll zunächst ein Reihe von Einflussfaktoren aufgezählt werden, wie sie teilweise bei Salton und McGill (1983) [->] zu finden sind:

  • Auswahl und Eingabe der Dokumente (input policies) bestimmen die Ausrichtung der Inhalte der Datenbank, die "Tiefe" der Behandlung von Themen, die Aktualität der Dokumente und die Fehlerrate in den Dokumenten. Es ergeben sich auch Unterschiede - je nachdem, ob die Dokumente speziell für die Sammlung erzeugt oder vorhandene Dokumente verwendet werden.
  • Die Dokumentformate (physical input form) bestimmen, in welcher Form Dokumente gespeichert werden und was sie beinhalten können. Das kann z.B. die Länge und Ausführlichkeit der Dokumente betreffen, also, ob beispielsweise nur Titel und Abstracts oder ganze Artikel gespeichert werden. Dokumentformate können auch festlegen, wie Bilder, Tondokumente oder andere multimediale Dokumente abgelegt werden. Dadurch wird auch die interne Repräsentation von Dokumenten und damit der Zugriff beim Suchen beeinflusst.
  • Die Indexierungsmethode (indexing language) legt ganz allgemein die Repräsentation der Dokumente für die Suche fest. Spezieller kann sie z.B. ein kontrolliertes Vokabular und Regeln für die Indexierung angeben. Dabei muss festgelegt werden, wie spezifisch bzw. wie breit die Dokumente indexiert werden sollen. Ob also jeweils die spezifischsten Terme, die ein Dokument beschreiben, verwendet werden sollen, um einen genauen Zugriff zu ermöglichen, oder allgemeinere Terme, um das Dokument auch zu finden, wenn mit allgemeineren Termen gesucht wird.
  • Wird die Indexierung von Hand vorgenommen, ist auch der Indexierungsvorgang (indexing operation) ein Einflussfaktor. Die Erfahrungen und Interessen, ebenso wie die Motivation der Indexierenden, beeinflussen die Konsistenz der Indexierung durch verschiedene Indexierende.
  • Die Anfrageformulierung durch die Nutzenden ist von vielen Faktoren abhängig, u. a. vom fachlichen Kenntnisstand der Anfragenden und von ihrer Vertrautheit mit dem IR-System.
  • Bei der Suche selbst (search operation) sollten neben den verschiedenen Methoden auch Präferenzen der Anfragenden berücksichtigt werden, z.B. ob sie mehr Wert auf eine vollständige Abdeckung der Frage legen oder auf eine überschaubare Antwortmenge.
  • Schließlich entscheidet auch die Präsentation der Ergebnisse mit darüber, ob die Anfragenden Nutzen aus der Recherche ziehen können. Insbesondere bei Systemen mit Feedback, bei denen also mehrere aufeinander aufbauende Fragen gestellt werden können, ist es wichtig, dass die Anfragenden die gefundenen Dokumente gut erfassen und beurteilen können.
Schon diese unvollständige Aufzählung zeigt, dass eine systematische Variation all dieser Einflussfaktoren kaum zu bewältigen ist. Sie wurde 1983 für Sammlungen aufgestellt, die systematisch erzeugt werden. Um Suchmaschinen auf Sammlungen zu untersuchen, die nicht systematisch für das IR erzeugt wurden - wie Dokumentenarchive von Organisationen oder das Web - müssen weitere Einflussfaktoren berücksichtigt werden.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Bewertung und Vergleich von IR-Systemen
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.3.7.1Einflussfaktoren
Einflussfaktoren, input policies, Dokumentformat, physical input form, Indexierungsmethode, indexing language, kontrolliertes Vokabular, Indexierungsvorgang, indexing operation, search operation Dokumentformat, Einflussfaktoren, Indexierungsmethode, Indexierungsvorgang, indexing language, indexing operation, input policies, kontrolliertes Vokabular, physical input form, search operation

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.