Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden
Stichwörter dieser Seite Wissensgewinnung, Regel, Machine Learning
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

2.1: Einleitung

Die im vorigen Teil 1.3 dargestellten IR-Systeme liefern zu einer Anfrage Dokumente aus einer Sammlung. Sie liefern im Allgemeinen aber nicht das, was umgangssprachlich als Antwort auf eine Frage bezeichnet wird. Für genau eingegrenzte Themenbereiche versuchen Expertensysteme das zu leisten - wie das unter den einleitenden Beispielen erwähnte Fahrplan-Auskunftssystem (Abschnitt 1.1.6 ). Diese Systeme brauchen in der Regel genau für diesen Zweck konstruierte Daten, mit deren Hilfe die richtigen Antworten generiert werden können. In vielen Fällen liegen jedoch Daten vor, die für andere Zwecke gesammelt wurden und deshalb nicht die erforderliche Form und Genauigkeit haben.

Wissensgewinnungs- oder Knowledge-Discovery-Verfahren versuchen diese Lücke zu schließen, indem sie Regelmäßigkeiten bzw. explizite Regeln aus Datensammlungen extrahieren, die geeignet sind, Menschen und Maschinen bei Entscheidungen zu unterstützen. Im Beispiel 1.1.9 der Einführung waren aus vier Attributen, die einen neuen Kunden beschreiben, zwei ausgewählt worden, mit denen für die Beispielmenge die richtigen Entscheidungen getroffen werden können, wenn die Attribute in der richtigen Weise eingesetzt werden. Auch wenn es bei Texten im Allgemeinen nicht so einfach ist, eine handhabbare Menge von einfachen Attributen zu bestimmen, sollen im Folgenden einige Wissensextraktionsverfahren vorgestellt werden. Neben den eigentlichen Algorithmen werden dabei insbesondere die Rahmenbedingungen dargestellt, unter denen die Verfahren entwickelt werden und arbeiten, um Parallelen und Unterschiede zum Text-Retrieval aufzuzeigen.

Ziel der Wissensgewinnungsverfahren ist es, Entscheidungsprozesse dadurch zu verbessern, dass Regelmäßigkeiten des betrachteten Themengebiets erkannt und genutzt werden - und zwar durch Maschinen und Menschen. Beim Menschen und anderen Lebewesen spricht man bei einem solchen Vorgang im Allgemeinen von Lernen. Man kann - wie in der Einführung beschrieben - diesen Begriff auch auf Maschinen anwenden und von Machine Learning sprechen. Die Parallele zwischen Mensch und Maschine bezieht sich allerdings (zumindest bisher) im Wesentlichen auf eine "Black-Box-Betrachtung": Ein "System" ändert sein Verhalten unter dem Einfluss äußerer Faktoren. Was wir über die Prozesse wissen, die dabei ablaufen, ist sehr unterschiedlich. Während bei Maschinen die Einzelschritte als Algorithmen und Methoden konstruiert werden, kann bei Lebewesen im Wesentlichen das Ergebnis der Prozesse beobachtet werden. Aus diesen Beobachtungen versucht die Psychologie bzw. die Cognitive Science Rückschlüsse auf die Natur der Prozesse zu ziehen.

Bei der Entwicklung von IR-Systemen geht es zwar nicht primär darum, menschliches Verhalten zu erklären, sondern vor allem darum, Systeme zu entwickeln, die Nutzende möglichst effektiv unterstützen. Dazu sollte aber die maschinelle Informationsverarbeitung auf die menschliche abgestimmt werden (auch wenn es heute häufig noch umgekehrt ist). Deshalb soll dieses Kapitel zunächst mit einem kleinen Exkurs zum Thema Lernen begonnen werden.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
2.1Einleitung
Wissensgewinnung, Regel, Machine Learning Machine Learning, Regel, Wissensgewinnung

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.