Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren -> Multivariate Entscheidungsbäume -> Attributauswahl
Stichwörter dieser Seite impurity
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

2.3.9.1.3: Das CART-Verfahren

Als eine andere Methode, die berechneten Koeffizienten zu verwenden, beschreiben Brodley und Utgoff das von Breiman, Friedman, Olshen und Stone (1984) [->] eingeführte CART-Verfahren. Dabei wird als Gütefunktion - ähnlich wie das Entropiemaß beim ID3-Algorithmus - ein Maß für die Vermischung (impurity) der Zielmengen verwendet. Zur Bestimmung der zu verwendenden Attribute wird eine Rückwärtselimination durchgeführt, bei der die Koeffizienten aber nicht neu berechnet werden. Es wird lediglich jeweils ein Attribut versuchsweise weggelassen und dann die Vermischung berechnet. Für das Attribut, bei dem die Vermischung am meisten steigt, wird die Schwelle, also der Wert x0 , optimiert, die anderen Koeffizienten werden aber nicht verändert. Ist der Quotient aus dem damit erzielten Vermischungsgrad und der größten Vermischungszunahme kleiner als eine vorgegebene Schranke, wird das Attribut tatsächlich weggelassen. Erst wenn dieses Verfahren beendet ist, werden für die übriggebliebenen Attribute neue Koeffizienten berechnet. Falls das so gewonnene zusammengesetzte Attribut besser als alle Einzelattribute ist, wird es als Attribut des Knotens verwendet, sonst wird das beste Einzelattribut benutzt.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren -> Multivariate Entscheidungsbäume -> Attributauswahl
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
2.3.9.1.3Das CART-Verfahren
impurity impurity

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.