3.5.1:
Einflussfaktoren
Um einen Eindruck zu vermitteln, in wie vielen Aspekten sich IR
Systeme unterscheiden können, soll zunächst ein Reihe von
Einflussfaktoren aufgezählt werden, wie sie bei Salton und McGill
(1983 [->]) zu finden sind.
- Auswahl und Eingabe der Dokumente (
input
policies) bestimmen die Ausrichtung der Inhalte der
Datenbank, die "Tiefe" der Behandlung von Themen, die
Aktualität der Dokumente und die Fehlerrate in den Dokumenten.
Unterschiede ergeben sich auch, je nach dem, ob die Dokumente speziell
für die Sammlung erzeugt werden, oder ob vorhandene Dokumente
verwendet werden.
- Die Dokumentformate (
physical input form)
bestimmen, in welcher Form Dokumente gespeichert werden und was sie
beinhalten können. Das kann z. B. die Länge und
Ausführlichkeit der Dokumente betreffen, also ob beispielsweise nur
Titel und Abstracts oder ganze Artikel gespeichert werden.
Dokumentformate können auch festlegen, wie Bilder, Tondokumente
oder andere multimediale Dokumente abgelegt werden. Dadurch wird auch
die interne Repräsentation von Dokumenten und damit auch der
Zugriff beim Suchen beeinflusst.
- Die Indexierungsmethode (
indexing language)
gibt ganz allgemein die
Repräsentation der
Dokumente für die Suche an. Spezieller kann sie z. B. ein
kontrolliertes Vokabular und Regeln für die Indexierung angeben.
Dabei muß auch festgelegt werden, wie spezifisch bzw. wie breit
die Dokumente indexiert werden sollen. Ob also jeweils die
spezifischsten Terme, die ein Dokument beschreiben, verwendet werden
sollen, um einen genauen Zugriff zu ermöglichen, oder eher
allgemeinere Terme, um das Dokument auch noch zu finden, wenn mit
allgemeineren Termen gesucht wird.
- Wird die Indexierung von Hand vorgenommen, ist auch der
Indexierungsvorgang (
indexing operation) ein
Einflussfaktor. Die Erfahrungen und Interessen, ebenso wie die
Motivation der Indexierenden, beeinflussen die Konsistenz der
Indexierung durch verschiedene Indexierende.
- Die Anfrageformulierung durch die Nutzenden ist von vielen
Faktoren abhängig. Unter anderem vom fachlichen Kenntnisstand der
Anfragenden und von ihrer Vertrautheit mit dem IR System.
- Bei der Suche selbst (
search operation)
sollten neben den verschiedenen Methoden auch Präferenzen der
Anfragenden berücksichtigt werden, z. B. ob sie mehr Wert auf eine
vollständige Abdeckung der Frage legen oder auf eine
überschaubare Antwortmenge.
- Schließlich entscheidet auch die Präsentation der
Ergebnisse mit darüber, ob die Anfragenden Nutzen aus der Recherche
ziehen können. Insbesondere bei Systemen mit Feedback, bei denen
also mehrere aufeinander aufbauende Fragen gestellt werden können,
ist es wichtig, dass die Anfragenden die gefundenen Dokumente gut
erfassen und beurteilen können.
Schon diese unvollständige Aufzählung zeigt, dass eine
systematische Variation all dieser Einflussfaktoren kaum zu
bewältigen ist. Sie wurde 1983 für Sammlungen aufgestellt, die
systematisch erzeugt werden. Um Suchmaschinen auf Sammlungen zu
untersuchen, die nicht systematisch für das IR erzeugt wurden, wie
z. B. Dokumentarchive eines Unternehmens oder einer Organisation oder
das WWW, müssen natürlich weitere Einflussfaktoren
berücksichtigt werden.
© 2000 / HTML-Version 14. 1. 2000: R. Ferber