Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren -> Rahmenbedingungen für Lernalgorithmen
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

2.3.5.2: Größe von Entscheidungsbäumen

Die Höhe eines ID3-Entscheidungsbaums ist also durch die Anzahl der vorhersagenden Attribute beschränkt. Die tatsächliche Höhe hängt natürlich auch von der Anzahl der Kategorien und ihrer Verteilung auf die Tupel ab. Als Extremfälle können die folgenden Situationen betrachtet werden: Wenn die Anzahl der Kategorien gleich der Anzahl der möglichen Tupel ist, muss der Baum die maximale Höhe haben und alle Pfade im Baum haben die volle Länge, nämlich die Anzahl der Attribute in den Beispielen. Wenn nur eine Kategorie existiert, ist keine Kategorisierung notwendig und der Baum hat die Höhe 1 .

Dass aber neben der Anzahl der Kategorien auch deren Definition entscheidenden Einfluss auf die Größe des Baums hat, zeigt Abbildung 54 . Hier bilden die Tupel mit gerader Quersumme die Kategorie E und die mit ungerader Quersumme die Kategorie O. Der Baum hat maximale Größe, obwohl nur zwei Kategorien vorliegen. Das liegt daran, dass die Quersumme nur bestimmt werden kann, wenn alle Attribute tatsächlich einbezogen werden. Daraus ergibt sich auch, dass es mit den vorgegebenen Attributen keinen kleineren Entscheidungsbaum geben kann. Würde man z.B. zwei Kategorien definieren, eine mit den Tupeln mit einer Quersumme im Bereich [0,2] und eine mit Tupeln mit der Quersumme 3 , ergäbe sich ein wesentlich kleinerer Baum (siehe Abbildung 55 ).

Das Beispiel zeigt auch, dass die Wahl der Attribute (wenn denn eine Wahl besteht) entscheidenden Einfluss auf die Aufwändigkeit der Lösung eines Problems hat.

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 54: Maximaler Entscheidungsbaum mit zwei Kategorien

Pfeil als Kennzeichnung einer Unterueberschrift Abbildung 55: Entscheidungsbaum mit zwei Kategorien

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren -> Rahmenbedingungen für Lernalgorithmen
Dieser Abschnitt und seine Unterabschnitte
Inhalt
2.3.5.2Größe von Entscheidungsbäumen
Abb. 54 Maximaler Entscheidungsbaum mit zwei Kategorien
Abb. 55 Entscheidungsbaum mit zwei Kategorien

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 17-11-2003 erzeugt.