ZURÜCK

4.2.1: Attribute und Kategorien

Formal handelt es sich bei der Kategorisierung also um eine Klassifikation von Tupeln einer Faktendatenbank, wie sie im Abschnitt _3.3.1_ eingeführt wurde. Dabei ist die Klassifikation im Allgemeinen aber nicht hierarchisch. Sie wird auf den Tupeln, die durch die Attribute aus den Dokumenten oder Objekten erzeugt werden, durchgeführt. Die Begriffe Kategorie und Klasse werden allerdings nicht von allen Autorinnen und Atuoren synonym verwendet.

ZUGANG4.2.1.1: Kategorisierung

ZUGANG4.2.1.2: Nach einem Attribut kategorisieren

Mit diesen Definitionen kann das induktive Lernen eines Kategorisierungsmechanismus im Data Mining so formuliert werden:

ZUGANG4.2.1.3: Induktiv erzeugter Kategorisierungsalgorithmus:

Formal kann man immer annehmen, dass es nur ein vorherzusagendes Attribut A0 gibt, da ja immer die Attribute Ai:D->R , iZ zu einem (mehrdimensionalen) Attribut zusammengefasst werden können. Dieses Vorgehen muss aber nicht immer günstig sein.

Lässt man in der obigen Definition die Forderung, dass die vorherzusagenden Attribute endliche Wertemengen haben sollen, weg, ergibt sich eine etwas allgemeinere induktive Lernaufgabe, die z. B. darin bestehen kann, Parameter zu schätzen. Die meisten der folgenden Überlegungen gelten auch für diesen Fall.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber