Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren -> Der ID3-Algorithmus -> Formale Beschreibung des ID3-Algorithmus
Stichwörter dieser Seite Wertebereich
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

Algorithmus 3: ID3 im Detail

Sei
Ai:D->Ri, i=1,.. .,n
eine Menge vorhersagender Attribute mit endlichen Wertebereichen Ri auf einer endlichen Menge D von Beispielen und A0:D->R0={z1,...,zm} ein vorherzusagendes Attribut. Im folgenden rekursiven Algorithmus bezeichne N=(A,K,z) den aktuellen Knoten, wobei AMathematisches Zeichen: Element von{A0,...,An} das aktuelle Attribut, KMathematisches Zeichen: TeilmengeD die Menge der Beispiele, die dem Knoten zugeordnet sind, und zMathematisches Zeichen: Element vonR0 eine Kategorie bezeichnen.

  1. Ordne alle Beispiele einem (Wurzel-) Knoten zu:
    N=(A,K,z)=N0,0 =(A,K0,0,z),  K0,0=D
  2. Falls alle Tupel aus K derselben Kategorie angehören, falls also gilt A0(di) =zk Mathematisches Zeichen: fuer alle di Mathematisches Zeichen: Element vonK und ein zkMathematisches Zeichen: Element vonR0 , setze A:=A0 und z=zk . Andernfalls wähle ein Attribut Ai:D->Ri ,  iMathematisches Zeichen: Element von{1,...,n} , das in K mindestens zwei verschiedene Werte annimmt ( Mathematisches Zeichen: Es existiert d1,d2Mathematisches Zeichen: Element vonK mit Ai(d1) Mathematisches Zeichen: ungleichAi(d2) ) als aktuelles Attribut für den Knoten N und füge für jeden Wert rjMathematisches Zeichen: Element vonRi mit A-1i({rj })Mathematisches Zeichen: DurchschnittKMathematisches Zeichen: ungleichØ des Attributs einen Kindknoten Ni,rj=(A,Ki,rj ) mit unbestimmtem aktuellem Attribut A und
    Ki,rj=A-1i( {rj}) Mathematisches Zeichen: DurchschnittK
    an (also mit den Beispielen aus K , bei denen das Attribut Ai den Wert rj annimmt).
  3. Falls ein unbearbeiteter Kindknoten Ni,rj von N existiert, setze N:=Ni,rj . Andernfalls prüfe, ob es einen unbearbeiteten Geschwisterknoten Ni,rk von N gibt und setze in diesem Fall N:=Ni,rk . Ist das auch nicht der Fall, setzte N auf den Elternknoten von N .
  4. Falls NMathematisches Zeichen: ungleichN0,0 gilt, gehe zu Schritt 2, andernfalls beende den Algorithmus.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Kategorisieren -> Der ID3-Algorithmus -> Formale Beschreibung des ID3-Algorithmus

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.