Titelblatt des Buchs
Reginald Ferber Information Retrieval
Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web

Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Ein komplexeres Beispiel
Stichwörter dieser Seite Geschwindigkeitsindikator
Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]

2.6.2: Lösungsansätze

Es gibt einige nahe liegende Indikatoren für den Missbrauch einer Telefonkennung, z.B. gleichzeitiges Telefonieren oder Telefonate in kurzem zeitlichem Abstand von weit auseinander liegenden Orten aus (Geschwindigkeitsindikatoren). Solche Indikatoren sind als hinreichende Bedingungen verhältnismäßig zuverlässig, treten aber nur auf, wenn eine Kennung (von beiden Telefonen aus) viel und zu ähnlichen Tages- bzw. Wochenzeiten genutzt wird. (Sie treten also nicht notwendigerweise bei Missbrauch auf.) In vielen Fällen, in denen sich die Nutzung nicht überlappt, ist es deshalb nur schwer möglich, ohne Kenntnis des Verhaltens der Nutzenden Missbräuche zu erkennen.

Eine direkte Anwendung eines der bisher besprochenen Lernalgorithmen auf alle Datensätze verspricht also nur für die wenigen hinreichenden Bedingungen des Missbrauchs erfolgreich zu sein. Wenn es darum geht, Missbrauch daran zu erkennen, dass sich das Nutzungsverhalten ändert, kann man nicht erwarten, dass Lernalgorithmen bei direkter Anwendung sonderlich erfolgreich sind, da verschiedene Nutzende natürlich sehr unterschiedliches Verhalten zeigen können. Zudem sollte ein falscher Alarm vermieden werden, wenn sich bei legaler Nutzung das Verhalten ändert. Es muss also darum gehen, das Verhalten der einzelnen Nutzenden so gut zu charakterisieren (z.B. durch Profile), dass Abweichungen, die durch Missbrauch verursacht sind, bemerkt werden können. Andererseits sollte die automatische Erkennung nicht so empfindlich sein, dass sie bei "normalen" Verhaltensänderungen bereits einen Missbrauch meldet.

Wollte man die Datensätze für jede einzelne Kennung als separate Beispielmenge eines Lernproblems betrachten, bräuchte man für jede Kennung auch Missbrauchsdaten, die aber gerade nicht vorliegen, solange der Missbrauch von den Nutzenden nicht erkannt wurde. Wenn er erkannt wurde, wird die automatische Erkennung allenfalls für den nächsten Missbrauch benötigt. Es müssen also andere Wege beschritten werden, um die Merkmale des Nutzungsverhaltens in die Lernaufgabe einzubringen.

Navigation Zurück ]    [ Inhalt ]    [ Stichwörter ]    [ Feedback ]    [ Home ]
Position im Angebot Information Retrieval -> Wissensgewinnung mit Data-Mining-Methoden -> Ein komplexeres Beispiel
Dieser Abschnitt und seine Unterabschnitte
Inhalt Stichwörter in der Reihenfolge ihres AuftretensStichwörter alphabetisch sortiert
2.6.2Lösungsansätze
Geschwindigkeitsindikator Geschwindigkeitsindikator

Diese Seiten sind urheberrechtlich geschützt. Die Verantwortung für die Inhalte und die Rechte der Online-Version liegen beim Autor Reginald Ferber, Münster (Westf). Die Rechte der gedruckten Version beim dpunkt.verlag, Heidelberg. Die Weiterverwendung von Texten oder Abbildungen - auch auszugsweise - ist ohne die schriftliche Zustimmung des Autors Reginald Ferber bzw. des dpunkt.verlags nicht gestattet.

Es wird darauf hingewiesen, dass die verwendeten Soft- und Hardware-Bezeichnungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken-, oder patentrechtlichem Schutz unterliegen. Alle Angaben und Programme wurden mit großer Sorgfalt kontrolliert. Trotzdem kann keinerlei Haftung für Schäden irgendwelcher Art übernommen werden, die sich im Zusammenhang mit der Nutzung dieser Seiten ergeben.

Diese HTML-Datei wurde am 27-10-2003 erzeugt.