| ||||||||||||||||||
2.3.9: Multivariate EntscheidungsbäumeNeben dem Ableiten vereinfachter Attribute können neue Attribute auch aus mehreren Attributen zusammengesetzt werden. Auch dabei muss natürlich darauf geachtet werden, dass das Skalenniveau der Attribute diese Operationen erlaubt. Unter einem zusammengesetzten Attribut versteht man eine Funktion, in die mehrere Attribute eingehen. Als Beispiel kann man aus zwei reellwertigen Attributen A1,A2:D->R das zusammengesetzte Attribut Az:D->{0,1} mit
Die Menge möglicher Funktionen, nach denen zusammengesetzte Attribute konstruiert werden können, ist im Allgemeinen sehr groß. Sie kann deshalb nicht vollständig nach geeigneten Funktionen durchsucht werden. Man muss sich also auf eine handhabbare Klasse von Funktionen beschränken. Eine solche Klasse ist z.B. die der Linearkombinationen aus Attributen, die mit einer Schwellwertfunktion versehen sind. (Als Linearkombination bezeichnet man eine gewichtete Summe von Variablen, hier also Attributen.) Sie setzt Attribute mit einem entsprechenden Skalenniveau, also z.B. Intervallskalen, voraus. (Manchmal kann es sinnvoll sein, Attribute mit Nominalskalen in einzelne Attribute zu zerlegen, die angeben, ob ein Wert angenommen wird oder nicht. Diese binären Attribute können dann mit {0,1} kodiert und in eine Linearkombination einbezogen werden (siehe Brodley und Utgoff, 1995 [->] ), auch wenn sie streng genommen kein Intervallskalenniveau haben.) Brodley und Utgoff (1995) [->] vergleichen verschiedene Verfahren, mit denen multivariate Entscheidungsbäume mit Linearkombinationen von reellwertigen Attributen berechnet werden können. Dabei unterscheiden sie die Entscheidung zwischen zwei Zielmengen von der Einteilung in n>2 Zielmengen. (Hier wird von Zielmengen gesprochen, weil es sich um die Entscheidungen in einem Knoten handelt. Deshalb brauchen die Zielmengen keine Kategorien zu sein.) Bei zwei Zielmengen - also bei einem binären Entscheidungsbaum - kann man mit linearen Schwellwertfunktionen ( linear threshold unit, LTU) arbeiten. Dazu benötigt man einen Vektor x=(x0,...,xn) aus Koeffizienten für die beteiligten Attribute und einer Schwelle x0 . Übersteigt die mit den Koeffizienten gewichtete Summe der Attributwerte w1,...,wn die gegebene Schwelle, wird die eine Zielmenge angenommen, liegt sie unter der Schwelle, die andere. Die lineare Schwellwertfunktion ist also durch einen Koeffizientenvektor charakterisiert, der einen Koeffizienten mehr enthält (die Schwelle), als Attribute bearbeitet werden. Die Bedingung lässt sich mit w0=-1 , d:=(w0,w1,...,wn ) als Skalarprodukt d*x>0 schreiben. Bei mehr als zwei Zielmengen wird für jede Zielmenge ein solcher Koeffizientenvektor benötigt. Ein Tupel wird derjenigen Zielmenge zugewiesen, für die die mit dem zugehörigen Koeffizientenvektor gewichtete Summe der Attributwerte am größten ist. Dieses Verfahren wird auch als lineare Maschine (linear machine, LM) bezeichnet. Formal gesehen ist die lineare Schwellwertfunktion ein Spezialfall der linearen Maschine. Hat man nämlich eine lineare Maschine mit zwei Zielmengen, kann man die Entscheidung so charakterisieren:
Brodley und Utgoff unterteilen die Konstruktion einer multivariaten Entscheidungsfunktion für einen Knoten in verschiedene Schritte:
2.3.9.1: Attributauswahl2.3.9.2: Koeffizientenbestimmung2.3.9.3: EvaluierungInsgesamt muss aber gesagt werden, dass bei den multivariaten Verfahren so viele Variationsmöglichkeiten bestehen, dass die beschriebene Untersuchung nur Hinweise auf Unterschiede und Einflussfaktoren geben kann, sicherlich aber keine abschließende Bewertung der Verfahren darstellt. | ||||||||||||||||||
| ||||||||||||||||||
Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.
Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.
Diese HTML-Datei wurde am 27-10-2003 erzeugt.