Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Bewertung und Vergleich von IR-Systemen -> Die TREC-Experimente -> Die TREC-Experimente
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

Abbildung 46: Größe der Grundmenge der auf Relevanz beurteilten Dokumente

Adhoc Routing
möglich tatsächlich relevant möglich tatsächlich relevant
TREC-1 3300 1279 (39%) 277 (22%) 2200 1067 (49%) 371 (35%)
TREC-2 4000 1106 (28%) 210 (19%) 4000 1466 (37%) 210 (14%)
TREC-3 100 2700 1005 (37%) 146 (15%) 2300 703 (31%) 146 (21%)
TREC-3 200 5400 1946 (28%) 196 (10%) 4600 1333 (35%) 187 (14%)
TREC-4 4000 1345 (34%) 115 (8,5%) 2600 930 (35%) 131 (14%)

In den Spalten "möglich" ist die maximal mögliche Anzahl von Dokumenten in der Grundmenge angegeben, die sich aus der Anzahl der eingereichten Ergebnislisten ergibt. Die Spalten "tatsächlich" gibt an, wie viele verschiedene Dokumente tatsächlich in der Grundmenge waren. Die letzte Spalte gibt an, wie viele davon relevant waren. Die Prozentangaben beziehen sich immer auf die Gesamtzahl, die eine Spalte weiter links steht.

Bei den beiden TREC-3 Ergebnissen zeigt sich, dass der Anteil der relevanten Dokumente in der größeren Grundmenge, die aus den jeweils 200 besten Dokumenten gebildet wurde, um ca. ein Drittel kleiner ist als in der kleineren Gundmenge, bei der nur 100 Dokumente je Liste einbezogen wurden. Ihre komplexe Berechnung macht eine Einschätzung der Zahlenwerte allerdings schwierig. Die Daten für TREC-3 100 wurden aus Harman (1996) [->] übernommen, für TREC-3 200 daraus abgeleitet.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Grundlagen und klassische IR-Methoden -> Klassische Information-Retrieval-Verfahren -> Bewertung und Vergleich von IR-Systemen -> Die TREC-Experimente -> Die TREC-Experimente

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.