3.5.1:
Einflussfaktoren
Zunächst soll deshalb eine
Aufzählung von Einflussfaktoren, wie sie bei Salton
und McGill (1983 [->]) zu
finden ist, angegeben werden.
- Auswahl und Eingabe der Dokumente (
input
policies) bestimmen die Ausrichtung der Inhalte der Datenbank, die
"Tiefe" der Behandlung von Themen, die
Aktualität der Dokumente und die
Fehlerrate in den Dokumenten
- Die Dokumentformate (
physical input form)
bestimmen, in welcher Form Dokumente gespeichert werden und
was sie beinhalten können. Das
kann z. B. die Länge der Dokumente betreffen,
also ob nur Titel und
Abstracts oder ganze Artikel gespeichert werden. Es
kann auch beinhalten, in welchen Formaten
Bilder, Tondokumente oder andere multimediale Dokumente
abgelegt werden. Außerdem können dadurch
die Repräsentation von Dokumenten
und damit auch der
Zugriff beim Suchen festgelegt
werden.
- Die Indexierungsmethode (
indexing language)
gibt ganz allgemein die
Repräsentation der
Dokumente an. Spezieller kann sie z. B. ein
kontrolliertes Vokabular und
Regeln für die Indexierung
angeben. Dabei muß auch festgelegt werden,
wie spezifisch bzw.
wie breit die Dokumente indexiert werden sollen. Ob
also jeweils die spezifischsten Terme, die ein Dokument beschreiben,
verwendet werden sollen, um einen genauen Zugriff zu ermöglichen,
oder eher allgemeinere Terme, um das Dokument auch noch zu finden, wenn
mit allgemeineren Termen gesucht wird.
- Wird die Indexierung von
Hand vorgenommen, ist auch der
Indexierungsvorgang (
indexing
operation) ein Einflussfaktor. Die
Erfahrungen und Interessen, ebenso
wie die Motivation der Indexierenden, beeinflussen die Konsistenz der
Indexierung durch verschiedene
Indexierende.
- Die Anfrageformulierung durch die Nutzenden ist von
vielen Faktoren abhängig. Unter anderem vom
fachlichen Kenntnisstand der
Anfragenden und von ihrer
Vertrautheit mit dem IR System.
- Bei der Suche selbst
(
search operation)
sollten neben den verschiedenen Methoden auch
Präferenzen der Anfragenden
berücksichtigt werden, z. B. ob sie mehr Wert auf eine
vollständige Abdeckung der Frage
legen oder auf eine
überschaubare Antwortmenge.
- Schließlich entscheidet auch die
Präsentation der Ergebnisse mit
darüber, ob die Anfragenden Nutzen aus der Recherche ziehen
können. Insbesondere bei Systemen mit Feedback, bei denen also
mehrere aufeinander aufbauende Fragen gestellt werden können, ist
es wichtig, dass die Anfragenden die
dargebotenen Dokumente optimal
erfassen und beurteilen können.
Schon diese unvollständige Aufzählung zeigt, dass eine
systematische Variation all dieser Einflussfaktoren kaum zu
bewältigen ist. Sie wurde 1983 für Sammlungen aufgestellt, die
systematisch erzeugt werden. Um Suchmaschinen auf Sammlungen zu
untersuchen, die nicht systematisch für das IR erzeugt wurden, wie
z. B. Dokumentarchive eines Unternehmens oder einer Organisation oder
das WWW, müssen natürlich weitere Einflussfaktoren
berücksichtigt werden.
© 1999 / HTML-Version 13. 7. 1999: R. Ferber, email: R. Ferber