Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Klassifikationen
Stichwörter dieser Seite Anhängezahlen, Postkoordination, Facettenklassifikation, Faktendatenbank
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

1.3.3.2: Erweiterte Klassifikationssysteme

Um die geringe Flexibilität von präkoordinierten Klassifikationssystemen auszugleichen, wurden zusätzliche Mechanismen entwickelt, mit denen sie flexibler gemacht werden können. Das sind neben Doppelstellen so genannte Anhängezahlen. Damit werden Modifikationen beschrieben, die sich häufig wiederholen und verhältnismäßig unabhängig von den Begriffen sind, auf die sie angewendet werden. Das können z.B. Moderatoren sein, wie die Konstruktion "Wartung von ..." oder "Handel mit ...". Diese Anhängezahlen werden in der internationalen Dezimalklassifikation mit einem Strich an die Kennzahl des jeweiligen Begriffs angehängt.

Neben diesen allgemeinen Begriffen gibt es noch eine Reihe von Verknüpfungssymbolen, die ganz spezifische semantische Bedeutungen haben. Zum Beispiel wird durch das Gleichheitszeichen eine Sprache ausgedrückt: 860=20 bezeichnet "Spanische Literatur in englischer Sprache". Durch runde Klammern wird ein Ort spezifiziert: 622.33(493) bezeichnet "Kohlebergbau in Belgien". Die Anhängezahl -05 weist eine handelnde Person aus: 655.1-05 bezeichnet "Buchdrucker". (Alle Beispiele aus Manecke, 1997 [->] ) Durch solche Verfahren erhält die Klassifikation eine komplexere Syntax, mit der insbesondere komplexe Objekte genauer modelliert werden können. Sie gehen damit in Richtung eines Repräsentationsansatzes, wie er in der künstlichen Intelligenz weiterentwickelt wurde.

Diese Ansätze, Aspekte außerhalb der eigentlichen hierarchischen Klassifikation zu modellieren, indem Bezeichner erst bei der Einordnung eines Objekts konstruiert werden, bezeichnet man als Postkoordination.

Eine andere Weiterentwicklung der Klassifikationen hin zu mehr Flexibilität und einer stärkeren Ausdrucksfähigkeit sind Facettenklassifikationen. Hier werden zunächst so genannte Grundkategorien gebildet, die den Gesichtspunkten entsprechen, unter denen die Objekte betrachtet werden können. Für jede Grundkategorie werden dann als mögliche Werte so genannte Facetten angegeben. Diese Werte können auch hierarchisch strukturiert sein. Ein Bezeichner besteht jetzt aus Teileinträgen aus jeder Grundkategorie. Die Toman-Klassifikation für das Bibliothekswesen und die Informationsarbeit (beschrieben in Manecke, 1997 [->] ) enthält z.B. die in Abbildung 24 angegebenen Grundkategorien. Die Facettenwerte der ersten Grundkategorie "Leistungen" sind in Abbildung 25 angegeben.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 24: Die Grundkategorien der Toman Facettenklassifikation

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 25: Die Facettenwerte der ersten Grundkategorie der Toman-Facettenklassifikation

Die Facettenklassifikation kann als mehrdimensionales System angesehen werden, bei dem in jeder Dimension eine von den anderen Dimensionen (mehr oder weniger) unabhängige Klassifikation angewendet wird. Man kann sie in diesem Sinne als postkoordinierende Klassifikation betrachten, weil nicht alle möglichen Bezeichner (also alle möglichen Kombinationen von Klassifikationen in den einzelnen Dimensionen) vorher festgelegt werden müssen. Ein Bezeichner wird bei der Einordnung eines Objekts zusammengesetzt. Dadurch wird eine größere Flexibilität erreicht. Man sieht, dass die Facettenklassifikation dabei dem Modell einer Faktendatenbank sehr ähnlich ist: In einer fest vorgegebenen Anzahl von Grundkategorien (Attributen) müssen Angaben gemacht werden bzw. es muss explizit (durch eine Null) angegeben werden, dass keine Angaben gemacht werden sollen.

Diese Beobachtung ist durchaus symptomatisch: Durch die Systematik von Klassifikationen kann Wissen geordnet werden. Die Ordnungskriterien sind dabei aber häufig eher formal oder durch einen bestimmten Aspekt bestimmt. Damit sind sie in vielen Fällen wenig intuitiv und flexibel. Durch elektronische Systeme können komplexere, vielfältigere oder auch einfach mehrere parallele Systematiken angeboten werden, die im manuellen Betrieb nicht mehr zu bewältigen wären. Dadurch eröffnen sich weitere Zugriffswege zu Informationen.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Klassifikationen
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
1.3.3.2Erweiterte Klassifikationssysteme
Abb. 24 Die Grundkategorien der Toman Facettenklassifikation
Abb. 25 Die Facettenwerte der ersten Grundkategorie der Toman-Facettenklassifikation
Anhängezahlen, Postkoordination, Facettenklassifikation, Faktendatenbank Anhängezahlen, Facettenklassifikation, Faktendatenbank, Postkoordination

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.