![]() |
![]() |
![]() |
![]() |
Ähnlich wie im vorigen Abschnitt entwickelt, wird bei der Robertson-Sparck Jones Formel (Robertson, Walker, Hancock-Beaulieu & Gatford TREC 3 [->]; Robertson, Walker, Beaulieu, Gatford & Payne TREC 4 [->]) vorgegangen, mit der Gewichte für Terme in Abhängigkiet von einer Anfrage berechnet werden können. Als Gewicht für einen Term tk wird der Wert
In diese Formel gehen also wie beim probabilistischen Retrieval Modell aus dem vorhergehenden Abschnitt sowohl Relevanzbeurteilungen, die entweder aus Trainingsdaten oder aus dem Relevance Feedback stammen können, als auch statistische Daten des entsprechenden Terms (wie die Dokumenthäufigkeit) ein. Wenn keine Relevanzdaten vorliegen, können R(q) und R(q,k) auf Null gesetzt werden. Dann wird aus der Robertson - Spark Jones Formel eine IDF Formel:
{j | qj=1}vj=
j=1nvj·qj
Wenn die Gewichte aufgrund eines größeren Trainingskorpus berechnet werden sollen, erfordert das einen höheren Speicher - bzw. Rechenaufwand, da zu jeder Anfrage der Wert R(q) und zu jedem Term-Anfrage Paar der Wert R(q,k) gespeichert bzw. aus den Trainingsdaten oder dem Feedback ermittelt werden muss. Das Vorgehen ähnelt dem bei der "Dynamisierung des Dokumentraumes" wie es im Abschnitt _3.4.5_ über das SMART System beschrieben wurde. Allerdings werden bei der Robertson - Spark Jones Formel im Allgemeinen die Gewichte nur im Bezug auf eine Anfrage, also auch nur in einer Sitzung verändert.
![]() |
![]() |
![]() |
![]() |