Zurück Weiter

Inhalt:
Allgemeines Modell
Klassifikation im IR
Ähnlichkeitssuche
Vektorraummodell
Modell
Gewichtung
Ähnlichkeiten
Zwischenergebnis
Weiterentwicklungen
Relevance Feedback
Social Filtering
Web-Links nutzen
Assoziative Verfahren

Der PageRank-Algorithmus von Google
 
... nimmt an, dass:
  • Seiten, auf die viele Verweise zeigen, "gut" sind

  • Verweise von "guten" Seiten "wertvoll" sind

  • Verweise von "guten" Seiten, von denen wenige Verweise ausgehen, besonders "wertvoll" sind

Wenn s1 ... sm die Seiten bezeichnen, die auf eine Seite i verweisen und out (j) die Anzahl der Verweise in der Seite j angibt, läßt sich der Rang r (i) der Seite i formal so schreiben:

r (i) = (1-d) + d (
r (1)
out (1)
+ ... +
r (m)
out (m)
)

Daraus läßt sich ein lineares Gleichungssystem ableiten, in dem im Wesentlichen die Verbindungsmatrix auftritt:
eine quadratische Matrix bei der die Anzahl der Dokumente die Seitenlänge bestimmt und die eine 1 als Eintrag enthält, wenn zwischen den Dokumenten, die die Zeile und Spalte bestimmen, ein Verweis besteht (und sonst 0).

Reginald Ferber, Münster (Westf): Automatische Generierung von Inhaltsrepräsentationen
FH Darmstadt-Dieburg, 2003-07-02, http://information-retrieval.de/ferber/fh-darmstadt/html/index.html
HTML file generated 3. 7. 2003 by R. Ferber