ZURÜCK

4.2: Kategorisieren

Eine im KDD häufig untersuchte Aufgabenstellung ist die Kategorisierung bei der eine Menge von Beispielen oder Tupeln in endlich viele disjunkte Klassen (die hier auch Kategorien genannt werden) eingeteilt wird. Ziel ist es, Regeln zu finden, die für die einzelnen Tupel aufgrund ihrer Eigenschaften vorhersagen, in welche Klasse bzw. Kategorie sie gehören.

ZUGANG4.2.1: Attribute und Kategorien

ZUGANG4.2.2: Trainings- und Testset

ZUGANG4.2.3: Lernenparadigmen

ZUGANG4.2.4: Der ID3 Algorithmus

Im Folgenden sollen verschiedene Bedingungen, unter denen induktive Lernverfahren ablaufen, sowie Vorgehensweisen und Methoden, nach denen sie entwickelt und eingeteilt werden können, beschrieben werden. Als Beispiel wird dabei häufig der ID3 Algorithmus benutzt werden.

ZUGANG4.2.5: Konsistenz

ZUGANG4.2.6: Endlichkeit des ID3 auf konsistenten Trainingssets

ZUGANG4.2.7: Wertebereiche der Attribute

ZUGANG4.2.8: Bewertung

ZUGANG4.2.9: Inkonsistente Trainingssets

ZUGANG4.2.10: Unvollständige Beispiele

ZUGANG4.2.11: Größe und Repräsentativität des Trainingssets

ZUGANG4.2.12: Inkrementelles Lernen

ZUGANG4.2.13: Overfitting

ZUGANG4.2.14: Nachoptimierung von Bäumen und Algorithmen

ZUGANG4.2.15: Suchstrategien


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber