![]() |
![]() |
![]() |
![]() |
Die Dokumente werden in Cluster zusammengefasst. Das geschieht mit der single pass Methode:
Dieses Verfahren liefert Cluster, in denen ähnliche Dokumente zusammengefasst sind und die sich überlappen können. Es wird vor allem verwendet, um den Zugriff auf Dokumente zu beschleunigen. Dazu wird eine Anfrage zunächst mit den Zentroiden der Cluster verglichen. Ein Vergleich mit Dokumentvektoren findet dann nur noch in dem Cluster statt, dessen Zentroid dem Anfragevektor am ähnlichsten ist.
Dieses Verfahren kann auch mehrstufig angewendet werden, indem die Cluster einer Ebene wieder zu Clustern einer höheren Ebene zusammengefasst werden.
Damit dieses Verfahren effektiv ist, sollten die Cluster alle eine ähnliche mittlere Größe haben. Um das zu erreichen kann man
Die Verwendung von Dokumentclustern als Zugriffsverfahren scheint zur Zeit nicht weiterverfolgt zu werden.
![]() |
![]() |
![]() |
![]() |