Um einen Eindruck zu vermitteln, in wie vielen
Aspekten sich IR-Systeme unterscheiden können, soll zunächst
ein Reihe von Einflussfaktoren aufgezählt werden, wie
sie teilweise bei Salton und McGill (1983) [->]
zu finden sind:
- Auswahl und Eingabe der Dokumente (input policies)
bestimmen die Ausrichtung der Inhalte der Datenbank, die
"Tiefe" der Behandlung von Themen, die
Aktualität der Dokumente und die Fehlerrate in den Dokumenten.
Es ergeben sich auch Unterschiede - je nachdem, ob die
Dokumente speziell für die Sammlung erzeugt oder
vorhandene Dokumente verwendet werden.
- Die Dokumentformate (physical input form)
bestimmen, in welcher Form Dokumente gespeichert werden und
was sie beinhalten können. Das
kann z.B. die Länge und Ausführlichkeit der
Dokumente betreffen, also, ob beispielsweise nur Titel und
Abstracts oder ganze Artikel gespeichert werden.
Dokumentformate können auch festlegen, wie
Bilder, Tondokumente oder andere multimediale Dokumente
abgelegt werden. Dadurch wird auch die interne Repräsentation von Dokumenten
und damit der Zugriff beim Suchen beeinflusst.
- Die Indexierungsmethode (indexing language)
legt ganz allgemein die Repräsentation der
Dokumente für die Suche fest. Spezieller kann sie z.B. ein
kontrolliertes Vokabular und Regeln für die Indexierung
angeben. Dabei muss festgelegt werden, wie spezifisch bzw.
wie breit die Dokumente indexiert werden sollen. Ob
also jeweils die spezifischsten Terme, die ein Dokument beschreiben,
verwendet werden sollen, um einen genauen Zugriff zu ermöglichen,
oder allgemeinere Terme, um das Dokument auch zu finden, wenn
mit allgemeineren Termen gesucht wird.
- Wird die Indexierung von Hand vorgenommen, ist auch der
Indexierungsvorgang
(indexing operation) ein Einflussfaktor. Die
Erfahrungen und Interessen, ebenso
wie die Motivation der Indexierenden, beeinflussen die Konsistenz der
Indexierung durch verschiedene Indexierende.
- Die Anfrageformulierung durch die Nutzenden ist von
vielen Faktoren abhängig, u. a. vom fachlichen Kenntnisstand der Anfragenden und von ihrer
Vertrautheit mit dem IR-System.
- Bei der Suche selbst (search operation)
sollten neben den verschiedenen Methoden auch
Präferenzen der Anfragenden
berücksichtigt werden, z.B. ob sie mehr Wert auf eine
vollständige Abdeckung der Frage legen oder auf eine
überschaubare Antwortmenge.
- Schließlich entscheidet auch die
Präsentation der Ergebnisse mit
darüber, ob die Anfragenden Nutzen aus der Recherche ziehen
können. Insbesondere bei Systemen mit Feedback, bei denen also
mehrere aufeinander aufbauende Fragen gestellt werden können, ist
es wichtig, dass die Anfragenden die gefundenen Dokumente gut
erfassen und beurteilen können.
Schon diese unvollständige Aufzählung zeigt, dass eine
systematische Variation all dieser Einflussfaktoren kaum zu
bewältigen ist. Sie wurde 1983 für Sammlungen aufgestellt, die
systematisch erzeugt werden. Um Suchmaschinen auf Sammlungen zu
untersuchen, die nicht systematisch für das IR erzeugt wurden - wie
Dokumentenarchive von Organisationen oder
das Web - müssen weitere Einflussfaktoren
berücksichtigt werden.
|