Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren
Stichwörter dieser Seite Skalenniveau, Kategorie, multivariater Entscheidungsbaum, Linearkombination, Skalenniveau, Intervallskala, lineare Schwellwertfunktion, linear threshold unit, LTU, Skalarprodukt, lineare Maschine, linear machine, LM
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

2.3.9: Multivariate Entscheidungsbäume

Neben dem Ableiten vereinfachter Attribute können neue Attribute auch aus mehreren Attributen zusammengesetzt werden. Auch dabei muss natürlich darauf geachtet werden, dass das Skalenniveau der Attribute diese Operationen erlaubt. Unter einem zusammengesetzten Attribut versteht man eine Funktion, in die mehrere Attribute eingehen.

Als Beispiel kann man aus zwei reellwertigen Attributen A1,A2:D->R das zusammengesetzte Attribut Az:D->{0,1} mit

(86)
Az (d) = {
1 wenn A1( d)-A2(d) >c
0 sonst
bilden. Mit diesem Attribut könnten die Kategorien in Abbildung 64 direkt getrennt werden. Entscheidungsbäume, die zusammengesetzte Attribute verwenden, werden multivariate Entscheidungsbäume genannt.

Die Menge möglicher Funktionen, nach denen zusammengesetzte Attribute konstruiert werden können, ist im Allgemeinen sehr groß. Sie kann deshalb nicht vollständig nach geeigneten Funktionen durchsucht werden. Man muss sich also auf eine handhabbare Klasse von Funktionen beschränken. Eine solche Klasse ist z.B. die der Linearkombinationen aus Attributen, die mit einer Schwellwertfunktion versehen sind. (Als Linearkombination bezeichnet man eine gewichtete Summe von Variablen, hier also Attributen.) Sie setzt Attribute mit einem entsprechenden Skalenniveau, also z.B. Intervallskalen, voraus. (Manchmal kann es sinnvoll sein, Attribute mit Nominalskalen in einzelne Attribute zu zerlegen, die angeben, ob ein Wert angenommen wird oder nicht. Diese binären Attribute können dann mit {0,1} kodiert und in eine Linearkombination einbezogen werden (siehe Brodley und Utgoff, 1995 [->] ), auch wenn sie streng genommen kein Intervallskalenniveau haben.)

Brodley und Utgoff (1995) [->] vergleichen verschiedene Verfahren, mit denen multivariate Entscheidungsbäume mit Linearkombinationen von reellwertigen Attributen berechnet werden können. Dabei unterscheiden sie die Entscheidung zwischen zwei Zielmengen von der Einteilung in n>2 Zielmengen. (Hier wird von Zielmengen gesprochen, weil es sich um die Entscheidungen in einem Knoten handelt. Deshalb brauchen die Zielmengen keine Kategorien zu sein.)

Bei zwei Zielmengen - also bei einem binären Entscheidungsbaum - kann man mit linearen Schwellwertfunktionen ( linear threshold unit, LTU) arbeiten. Dazu benötigt man einen Vektor x=(x0,...,xn) aus Koeffizienten für die beteiligten Attribute und einer Schwelle x0 . Übersteigt die mit den Koeffizienten gewichtete Summe der Attributwerte w1,...,wn die gegebene Schwelle, wird die eine Zielmenge angenommen, liegt sie unter der Schwelle, die andere. Die lineare Schwellwertfunktion ist also durch einen Koeffizientenvektor charakterisiert, der einen Koeffizienten mehr enthält (die Schwelle), als Attribute bearbeitet werden. Die Bedingung lässt sich mit w0=-1 , d:=(w0,w1,...,wn ) als Skalarprodukt d*x>0 schreiben.

Bei mehr als zwei Zielmengen wird für jede Zielmenge ein solcher Koeffizientenvektor benötigt. Ein Tupel wird derjenigen Zielmenge zugewiesen, für die die mit dem zugehörigen Koeffizientenvektor gewichtete Summe der Attributwerte am größten ist. Dieses Verfahren wird auch als lineare Maschine (linear machine, LM) bezeichnet.

Formal gesehen ist die lineare Schwellwertfunktion ein Spezialfall der linearen Maschine. Hat man nämlich eine lineare Maschine mit zwei Zielmengen, kann man die Entscheidung so charakterisieren:
A (d) = {
1 falls d*x>d*y
0 sonst
Dabei sind x und y die Koeffizientenvektoren undd bezeichnet ein Werte-Tupel. d*x>d*y ist äquivalent zur Formulierung d*x-d*y>0 und weiter zu d*(x-y)>0 . Das heißt, (x-y) kann als Koeffizientenvektor einer äquivalenten linearen Schwellwertfunktion gewählt werden. Bei der Berechnung von Koeffizientenvektoren mit induktiven Lernverfahren muss aber geprüft werden, ob durch ein Verfahren für eine lineare Maschine die gleiche Entscheidungsfunktion gelernt wird wie bei einem für eine lineare Schwellwertfunktion.

Brodley und Utgoff unterteilen die Konstruktion einer multivariaten Entscheidungsfunktion für einen Knoten in verschiedene Schritte:

  • die Auswahl von Attributen, aus denen die Linearkombination zusammengesetzt werden soll,
  • die Bestimmung der Koeffizienten für mehrere verschiedene Linearkombinationen,
  • die Auswahl einer Linearkombination (also eines zusammengesetzten Attributs) für den aktuellen Knoten
In jedem dieser Schritte können unterschiedliche Optimierungskriterien verwendet werden. Dadurch können Funktionen konstruiert werden, die nur noch formal multivariat sind, tatsächlich aber nur von einem Attribut abhängen. Oder solche, die zwar mehrere Attributwerte einbeziehen, aber sie dann durch sehr kleine Koeffizienten nicht nutzen. Auch Entscheidungsfunktionen, die von allen Attributen abhängen, entsprechen nicht unbedingt der Idee von Entscheidungsbäumen.

Pfeil als Kennzeichnung einer Unterueberschrift 2.3.9.1: Attributauswahl

Pfeil als Kennzeichnung einer Unterueberschrift 2.3.9.2: Koeffizientenbestimmung

Pfeil als Kennzeichnung einer Unterueberschrift 2.3.9.3: Evaluierung

Insgesamt muss aber gesagt werden, dass bei den multivariaten Verfahren so viele Variationsmöglichkeiten bestehen, dass die beschriebene Untersuchung nur Hinweise auf Unterschiede und Einflussfaktoren geben kann, sicherlich aber keine abschließende Bewertung der Verfahren darstellt.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
2.3.9Multivariate Entscheidungsbäume
2.3.9.1Attributauswahl
2.3.9.1.1Sequenzielle Elimination und Auswahl
2.3.9.1.2Verteilungsbasiertes Eliminationsverfahren
2.3.9.1.3Das CART-Verfahren
2.3.9.2Koeffizientenbestimmung
2.3.9.3Evaluierung
Skalenniveau, Kategorie, multivariater Entscheidungsbaum, Linearkombination, Skalenniveau, Intervallskala, lineare Schwellwertfunktion, linear threshold unit, LTU, Skalarprodukt, lineare Maschine, linear machine, LM, Elimination, sequenzielle Rückwärtselimination, Sequential Backward Elimination, SBE, Auswahl, sequenzielle Vorwärtsauswahl, Sequential Foreward Selection, SFS, Top-down, Bottom-up, Heuristisches Sequenzielles Suchverfahren, HSS, verteilungsbasierte Rückwärtselimination, Dispersion-Guided Sequential Backward Elimination, DSBE, impurity, Methode der kleinsten Fehlerquadrate, Recursive Least Squares, RLS, Skalarprodukt, Pocket-Algorithmus, Trainingsmenge, Testmenge Auswahl, Bottom-up, Dispersion-Guided Sequential Backward Elimination, DSBE, Elimination, Heuristisches Sequenzielles Suchverfahren, HSS, impurity, Intervallskala, Kategorie, linear machine, linear threshold unit, lineare Schwellwertfunktion, lineare Maschine, Linearkombination, LM, LTU, Methode der kleinsten Fehlerquadrate, multivariater Entscheidungsbaum, Pocket-Algorithmus, Recursive Least Squares, RLS, SBE, Sequential Foreward Selection, Sequential Backward Elimination, sequenzielle Rückwärtselimination, sequenzielle Vorwärtsauswahl, SFS, Skalarprodukt, Skalarprodukt, Skalenniveau, Skalenniveau, Testmenge, Top-down, Trainingsmenge, verteilungsbasierte Rückwärtselimination

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.