- Inhalt:
- Allgemeines Modell
- Klassifikation im IR
- Ähnlichkeitssuche
- Vektorraummodell
- Modell
- Gewichtung
- Ähnlichkeiten
- Zwischenergebnis
- Weiterentwicklungen
- Relevance Feedback
- Social Filtering
- Web-Links nutzen
- Assoziative Verfahren
|
Der PageRank-Algorithmus von Google |
|
... nimmt an, dass:
- Seiten, auf die viele Verweise zeigen, "gut" sind
- Verweise von "guten" Seiten "wertvoll" sind
- Verweise von "guten" Seiten, von denen wenige Verweise ausgehen,
besonders "wertvoll" sind
Wenn s1 ... sm die Seiten bezeichnen,
die auf eine Seite i verweisen und
out (j) die Anzahl der Verweise in der Seite j
angibt, läßt sich der Rang
r (i)
der Seite
i
formal so schreiben:
r (i) = (1-d) + d ( |
r (1) |
|
out (1) |
|
+ ... + |
r (m) |
|
out (m) |
|
) |
Daraus läßt sich ein lineares Gleichungssystem ableiten, in dem im
Wesentlichen die Verbindungsmatrix auftritt:
eine quadratische Matrix
bei der die Anzahl der Dokumente die Seitenlänge bestimmt und die eine
1
als Eintrag enthält, wenn zwischen den Dokumenten, die die Zeile und
Spalte bestimmen, ein Verweis besteht (und sonst 0).
|