ZURÜCK

4.3.1: Einfache Regelsysteme

Bei der Konstruktion des Entscheidungsbaumes waren wir von einer Menge von Attributen ausgegangen, die jeweils eine bestimmte Wertemenge haben. Mit Hilfe der Attribute läßt sich ein Ast eines Entscheidungsbaums leicht in eine Menge von durch AND verknüpfte Bedingungen an Attribute bringen. Die dabei verwendeten Methoden stimmen mit denen im Booleschen Retrieval überein. Zunächst wird wieder für ein Attribut Ai:D->Ri und einen Wert rjRi des Attributs ein Attribut - Wert Paar oder eine elementare oder atomare Bedingung definiert , die durch Teilmengen von D charakterisiert ist:

(Ai=rj):=A-1i({rj})={dD | Ai(d)=rj}

Solche elementaren Bedingungen lassen sich zu zusammengesetzten Bedingungen verknüpfen, dabei heisst die Verknüpfung

(Ai=rk)(Aj=rl):=A-1i({rk})A-1j({rl})

Konjunktion oder AND-Verknüpfung und die Verknüpfung

(Ai=rk)(Aj=rl):=A-1i({rk})A-1j({rl})

Disjunktion oder OR-Verknüpfung. Schließlich läßt sich noch das Komplement einer Bedingung bilden:

(Airk):=(Ai=rk):=D\A-1i({rk})

Aufgrund der Definition über Mengen lassen sich die Verknüpfungen unmittelbar auf zusammengesetzte Bedingungen übertragen.

Als Beispiel kann die Menge der Beispiele im Blatt des linkesten Asts aus dem Baum in Abbildung _44_ folgendermaßen dargestellt werden: (A1=r1)(A2=r4)=A-11({r1})A-12({r4}) . Nimmt man weiter an, dass die Beispiele dieses Blattes des Baumes aus der Kategorie Kj sind, so kann man diesen Ast in eine Regel der Form

IF (A1(d)=r1)(A2(d)=r4) THEN dKj

umwandeln.

ZUGANGAbb. 51: Einige Formeln, die sich aus dem Entscheidungsbaum aus Abbildung ableiten lassen

Regeln haben die Vorteile, dass

Sie haben den Nachteil, dass viele der Bedingungen, nämlich die in der Nähe der Wurzel des Entscheidungsbaumes, oft gespeichert und überprüft werden müssen.

Man kann solche Regeln in Normalformen bringen, die eine automatisierte Verarbeitung erleichtern.

ZUGANG4.3.1.1: Normalformen

Die Regeln, die aus einem Entscheidungsbaum gewonnen werden, der durch einen ID3 Algorithmus erzeugt wurde, haben eine noch einfachere Form: sie sind, wie das obige Beispiel, Konjunktionen von elementaren Bedingungen. Diese einzelnen elementaren Bedingungen können wegen der Kommutativität der Durchschnittsbildung beliebig umsortiert werden.

Allerdings ergeben sich bei einem solchen Vorgehen sehr viele Regeln, die in vielen Teilen identisch sind: Die Teile des Baumes, die zwei Äste gemeinsam haben, erscheinen auch als gleiche elementare Bedinungen in den Regeln. Dadurch wird die Anzahl der Regeln aufgebläht und die Abarbeitung beschränkt sich im wesentlichen auf viele Einzelvergleiche. Im folgenden werde einige Verfahren genannt, mit denen der Zugriff effizienter gemacht werden kann.

ZUGANG4.3.1.2: Entscheidungslisten

ZUGANG4.3.1.3: Ripple-down Regelmengen

Bei der "manuellen" Konstruktion der Listen in den Beispielen aus den Abbildungen _52_ und _53_ waren wir von den Beispielen und nicht von einem Entscheidungsbaum ausgegangen. Im Prinzip lassen sich Regeln aus einem Trainingsset auf folgende einfache Weise gewinnen.

ZUGANG4.3.1.4: Formaler Algorithmus zur Regelbildung aus Beispielen

Wie man leicht sieht, kann auch dieser formale Algorithmus als ein Beweis der Aussage aus Abschnitt _4.2.5_ verwendet werden, dass zu jedem endlichen konsistenten Trainingsset ein KDD Verfahren existiert, das einen Algorithmus konstruiert, mit dem die Elemente des Trainingssets richtig kategorisiert werden können.

ZUGANGAbb. 54: Verallgemeinerung einer Bedingung durch Hinzufügen einer elementaren Bedingung zu einer Disjunktion

ZUGANGAbb. 55: Verallgemeinerung von Regeln, die aus einigen Beispielen aus Abbildung gewonnen wurden

ZUGANG4.3.1.5: Top-Down und Bottom-Up Methoden

Im folgenden soll ein Verfahren vorgestellt werden, das den formalen Algorithmus in eine praxistaugliche Form bringt.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber