| ||||||||||||
2.3.6: Einfache RegelsystemeDie Konstruktion eines ID3-Entscheidungsbaums ging von einer Menge von Attributen aus, die jeweils eine bestimmte Wertemenge haben. Ein Ast eines Entscheidungsbaums lässt sich in eine Menge von durch AND verknüpfte Bedingungen an die Attribute übertragen, die in den Knoten des Asts vorkommen. Dabei können die gleichen Methoden verwendet werden wie beim booleschen Retrieval. Zunächst wird wieder für ein Attribut Ai:D->Ri und einen Wert rjRi des Attributs ein Attribut-Wert-Paar oder eine elementare (bzw. atomare) Bedingung definiert , die durch Teilmengen von D charakterisiert ist:
So wird die Menge der Beispiele aus dem ganz links liegenden Blatt im Baum aus Abbildung 51 durch folgende Bedingungen beschrieben:
Regeln haben die Vorteile, dass
Definition 14: NormalformenDie Regeln, die aus einem Entscheidungsbaum gewonnen werden, der durch einen ID3-Algorithmus erzeugt wurde, haben eine noch einfachere Form: Sie sind, wie das obige Beispiel, Konjunktionen von elementaren Bedingungen. Diese einzelnen elementaren Bedingungen können wegen der Kommutativität der Durchschnittsbildung beliebig umsortiert werden. Abbildung 57: Einige Regeln, die sich aus einem Entscheidungsbaum ableiten lassen.Allerdings ergeben sich bei einem solchen Vorgehen sehr viele Regeln, die in vielen Teilen identisch sind: Die Teile des Baums, die zwei Äste gemeinsam haben, erscheinen auch als gleiche elementare Bedingungen in den Regeln. Dadurch wird die Anzahl der Regeln aufgebläht und die Abarbeitung beschränkt sich im Wesentlichen auf viele Einzelvergleiche. Im Folgenden werde einige Verfahren genannt, mit denen der Zugriff effizienter gemacht werden kann, ohne dass ein kompletter Entscheidungsbaum verwendet wird. 2.3.6.1: Entscheidungslisten2.3.6.2: Ripple-down-RegelmengenBei der "manuellen" Konstruktion der Listen in den Beispielen aus den Abbildungen 58 und 59 wurde von den Beispielen und nicht von einem Entscheidungsbaum ausgegangen. Im Prinzip lassen sich Regeln aus einer Trainingsmenge auf folgende einfache Weise gewinnen: Algorithmus 5: Formale Regelbildung aus BeispielenWie man leicht sieht, kann auch dieser formale Algorithmus als ein Beweis der Aussage aus Abschnitt 2.3.5.1 verwendet werden, dass zu jeder endlichen konsistenten Trainingsmenge ein KDD-Verfahren existiert, das einen Algorithmus konstruiert, mit dem die Elemente der Trainingsmenge richtig kategorisiert werden können. Abbildung 59: Konstruktion eines Ripple-down Sets2.3.6.3: Top-down- und Bottom-up-MethodenIm Folgenden 2.3.7 soll ein Verfahren vorgestellt werden, das den formalen Algorithmus in eine praxistaugliche Form bringt. | ||||||||||||
| ||||||||||||
Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.
Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.
Diese HTML-Datei wurde am 27-10-2003 erzeugt.