ZURÜCK

4.4: Zusammengesetzte Attribute

Die bisher vorgestellten Regeln und Vergleiche stützen sich auf einzelne Attribute und ihre Werte. Beziehungen zwischen Attributen können nur über den Vergleich von Attributwerten ausgedrückt werden. So kann die Bedingung, dass zwei Attribute den gleichen Wert annehmen sollen , nur dadurch ausgedrückt werden, dass dies für jeden einzelnen Wert der Wertemengen aufgeschrieben bzw. abgeprüft wird. Lässt man Vergleiche zwischen Attributen zu, können häufig einfachere Regelsysteme formuliert werden. Ein Beispiel ist in Abbildung 59 gegeben. Andererseits ergeben sich damit viel mehr Möglichkeiten Regeln zu formulieren, d. h. der Suchraum für mögliche Regelsysteme wächst enorm an. Es werden dann gute Heuristiken oder sinnvolle Einschränkungen des Suchraumes benötigt, um noch in der Lage zu sein, mit annehmbarem Aufwand Regeln zu finden.

ZUGANGAbb. 59: Regeln, die auch Vergleiche von Attributen zulassen, auf einer Teilmenge der Beispiele aus Abbildung .

Beim ID3 Algorithmus war für jeden Knoten ein einziges Attribut ausgewählt worden, nach dem die Menge der Beispiele aufgeteilt wurde. Beim AQ Algorithmus wurden Regeln konstruiert, die sich aus Bedingungen an mehrere Attribute zusammensetzen. In beiden Verfahren waren nur einzelne Attributwerte betrachtet worden, d. h. nur das Nominalskalenniveau wurde genutzt. Auch im Beispiel _59_ wurde lediglich die Identität als Vergleichsoperator verwendet. Haben die Attribute ein höheres Skalenniveau, sind sie also z. B. reellwertig, können neben der Gleichheit weitere Eigenschaften genutzt werden.

Da die Komplexität der erzeugten Kategorisierungswerkzeuge (wie mehrfach erwähnt) stark von der Anzahl der angenommenen Attributwerte abhängt, ist es sinnvoll aus Attributen mit großen Wertebereichen Attribute zu konstruieren, die nur wenige unterschiedliche Werte annehmen können. Dabei muss allerdings die Struktur der Wertebereiche berücksichtigt werden. Für Attribute deren Wertebereich Ordinalskalenniveau hat, sind die einfachsten abgeleiteten Attribute Schwellwertfunktionen, die nur angeben, ob der angenommene Wert größer als eine fest vorgegebene Schwelle ist oder nicht. Die Schwelle wird auch Split oder splitting value genannt. Mit verschiedenen Splits können verschiedene vereinfachte Attribute aus einem Attribut abgeleitet werden.

ZUGANGAbb. 60: Beispiele, die sich mit einem zusammengestzten Attribut gut trennen lassen.

Betrachtet man reellwertige Beispieltupel als Punkte eines Vektorraums, so werden durch Schwellwertattribute Untermengen definiert, deren Grenzflächen parallel zu den Koordinatenachsen liegen. Um z. B. die in Abbildung _60_ gezeigten Punkte zu trennen, müssten mehrere Schwellwertattribute aus den Attributen A1 und A2 abgeleitet werden.

Eine andere Möglichkeit bestünde darin, Attribute abzuleiten, die die Intervalle zwischen den Schwellen als Werte annehmen. (Im angegebenen Beispiel würde das die Anzahl der Werte allerdings nicht verringern.) In beiden Fällen werden dadurch, dass nicht mehr einzelne Werte sonder Intervalle angegeben werden, verallgemeinerte Regeln erzeugt, die nicht nur die Punkte aus der Beispielmenge kategorisieren, sondern ganze Teilmengen der Ebene.

ZUGANG4.4.1: Multivariate Entscheidungsbäume


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber