3: Erweiterte Retrieval-Ansätze
In den ersten beiden Teilen wurden klassische Methoden
und Verfahren des Information Retrieval und der Wissensgewinnung dargestellt
und teilweise mit benachbarten Fachgebieten in Verbindung gesetzt.
In diesem Teil werden weitere theoretische Modellansätze und experimentelle
Systeme vorgestellt. Dabei zeigt sich, dass die theoretischen Modelle
schnell so komplex werden, dass sie sich auch mit modernen Rechnern und großen
Testkollektionen nicht implementieren lassen, ohne starke Vereinfachungen anzunehmen.
Diese Vereinfachungen führen häufig dazu, dass die abgeleiteten Systeme auch auf das
Vektorraummodell zurückgeführt werden können und so dem Anspruch, ein weitergehendes
Modell zu implementieren, nur bedingt gerecht werden.
Andererseits haben die TREC-Experimente gezeigt, dass sich durch
geschickt angewendete Heuristiken die Ergebnisse stark verbessern lassen.
Dabei haben sich einige Vorgehensweisen besonders bewährt. Diese
erfolgreichen Methoden und Ähnlichkeitsmaße wurden daraufhin von vielen
der an TREC teilnehmenden Systeme übernommen.
Wo es sinnvoll erscheint, wird auch in diesem Teil wieder kurz in
Theorien aus dem Umfeld des Information Retrieval eingeführt, um Beziehungen zu den
Nachbargebieten herzustellen.
|
Dieser Abschnitt und seine Unterabschnitte |
Inhalt |
Stichwörter in der Reihenfolge ihres Auftretens | Stichwörter alphabetisch sortiert |
|
Information Retrieval, Vektorraummodell, TREC, Ähnlichkeitsmaß, Vektorraummodell, Vektorraummodell, Wertebereich, Zugehörigkeitsfunktion, elementare Anfrage, Durchschnitt, Dokumentvektor, MMM-Modell, Dokumentvektor, Durchschnitt, Testkollektion, Ähnlichkeitsfunktion, Dokumentvektor, Skalarprodukt, P-Norm-Modell, Dokumentvektor, Fakten-Retrieval, Unabhängigkeit, Wahrscheinlichkeitsraum, endlicher Wahrscheinlichkeitsraum, Wahrscheinlichkeitsfunktion, Grundraum, Ereignis, elementares Ereignis, Elementarereignis, komplementäres Ereignis, Zufallsvariable, Unabhängigkeit, bedingte
Wahrscheinlichkeit, Bedingung, unabhängig, bayessche Formel, unabhängig, Relevanz, charakteristische Funktion, Quote, odds, Relevanzurteil, unabhängig, linked dependency
assumption, Rangfolge, Retrieval-Status-Wert, retrieval status
value, Relevance
Feedback, Trainingsmenge, Relevanz, Dokumenthäufigkeit, IDF, Skalarprodukt, Dokumentvektor, Query-Vektor, Relevanz, Thesaurus, Synonymmenge, Information Retrieval, Regel, Konsistenz, probabilistische
Inferenz, mögliche
Welt, possible world, Aussage, Rangfolge, Ähnlichkeitsfunktion, Vektorraummodell, Indikatorfunktion, charakteristische
Funktion, Imaging, IDF, Ähnlichkeitsmaß, bayessches Inferenznetz, Aussage, Dokumentennetz, document network, Dokumentenschicht, Textrepräsentationsschicht, Konzeptrepräsentationsschicht, Anfragenetz, query network, Relevanz, Rangfolge, Indexterm, IDF, Unabhängigkeit, invertierte Liste, Query-Vektor, Ähnlichkeitsfunktion, TREC, Passagen-Retrieval, Pseudo-Relevance-Feedback, Robertson-Sparck-Jones-Formel, Routing, Pseudo-Relevance-Feedback, Dokumentvektor, Rangfolge, Stammformenreduktion, IDF, Ähnlichkeitsfunktion, Skalarprodukt, Cosinus-Maß, Cosinus-Maß, Cosinus-Maß, Relevanz, Termhäufigkeit, Expansion, Ähnlichkeitsfunktion, Individual-Term-Locality-Maß, ITL-Maß, Ähnlichkeitssuche, Attribut, Expansion, Expansion, assoziativer Thesaurus, Phrasen, Vektorraummodell, Ad-hoc-Aufgabe, Narrative, Gewichtungsmethode, Confusion, Merging, Filtering, Routing, Rangfolge, Interactive, Multilingual, NLP, Cross Language, Very Large Corpus, Web Track, Spoken Document Retrieval, Question Answering, korpusbasiertes Verfahren, unabhängig, Unabhängigkeit, Stammformenreduktion, Synonymmenge, Thesaurus, unabhängig, Information Retrieval, Kookurrenzdaten, assoziative Regel, Attribut, Dokumenthäufigkeit, Assoziationstheorie, Grundformenreduktion, computerlinguistischer Ansatz, Oberflächenform, Synonymmenge, Granularität, Ähnlichkeitsmaß, Kookurrenzverfahren, Kookurrenzmodelle, Term-Dokument-Matrix, Wissensgewinnung, Nachrichtenagentur, Routing, Kategorie, Kategorisierung, Skalarprodukt, Term-Term-Matrix, themenspezifischer assoziativer Thesaurus, Rangfolge, Anfrageerweiterung, Query Expansion, Gewichtungsmethode, IDF, Expansion, Cosinus-Maß, Tanimoto-Maß, Unabhängigkeit, Ähnlichkeitsmaß, Expansion, Testkollektion, Term-Term-Matrix, Attribut, assoziativer Thesaurus, mehrsprachige Suche, mehrsprachiges Retrieval, assoziativer Thesaurus, cross language
retrieval, Schweizerische Depeschen-Agentur, Grundformenreduktion, Vektorraummodell, kontrolliertes Vokabular, Term-Term-Matrix, Thesaurus, Latent Semantic Indexing, Term-Dokument-Matrix, Gewichtungsmethode, Dokumentvektor, Abstract, Vektorraummodell, Darmstädter Indexierungsansatz, Darmstadt Indexing
Approach, DIA, Auftrittsform, relevance description, Attribut, SGML, XML, Attribut, Dokumentvektor, Ähnlichkeitsmaß, GroupLense, Kategorisierung, vorhersagendes Attribut, vorherzusagendes Attribut |
Abstract, Ad-hoc-Aufgabe, Ähnlichkeitsfunktion, Ähnlichkeitsfunktion, Ähnlichkeitsfunktion, Ähnlichkeitsfunktion, Ähnlichkeitsfunktion, Ähnlichkeitsmaß, Ähnlichkeitsmaß, Ähnlichkeitsmaß, Ähnlichkeitsmaß, Ähnlichkeitsmaß, Ähnlichkeitssuche, Anfrageerweiterung, Anfragenetz, Assoziationstheorie, assoziative Regel, assoziativer Thesaurus, assoziativer Thesaurus, assoziativer Thesaurus, Attribut, Attribut, Attribut, Attribut, Attribut, Auftrittsform, Aussage, Aussage, bayessche Formel, bayessches Inferenznetz, bedingte
Wahrscheinlichkeit, Bedingung, charakteristische
Funktion, charakteristische Funktion, computerlinguistischer Ansatz, Confusion, Cosinus-Maß, Cosinus-Maß, Cosinus-Maß, Cosinus-Maß, Cross Language, cross language
retrieval, Darmstadt Indexing
Approach, Darmstädter Indexierungsansatz, DIA, document network, Dokumentennetz, Dokumentenschicht, Dokumenthäufigkeit, Dokumenthäufigkeit, Dokumentvektor, Dokumentvektor, Dokumentvektor, Dokumentvektor, Dokumentvektor, Dokumentvektor, Dokumentvektor, Dokumentvektor, Durchschnitt, Durchschnitt, elementare Anfrage, Elementarereignis, elementares Ereignis, endlicher Wahrscheinlichkeitsraum, Ereignis, Expansion, Expansion, Expansion, Expansion, Expansion, Fakten-Retrieval, Filtering, Gewichtungsmethode, Gewichtungsmethode, Gewichtungsmethode, Granularität, GroupLense, Grundformenreduktion, Grundformenreduktion, Grundraum, IDF, IDF, IDF, IDF, IDF, Imaging, Indexterm, Indikatorfunktion, Individual-Term-Locality-Maß, Information Retrieval, Information Retrieval, Information Retrieval, Interactive, invertierte Liste, ITL-Maß, Kategorie, Kategorisierung, Kategorisierung, komplementäres Ereignis, Konsistenz, kontrolliertes Vokabular, Konzeptrepräsentationsschicht, Kookurrenzdaten, Kookurrenzmodelle, Kookurrenzverfahren, korpusbasiertes Verfahren, Latent Semantic Indexing, linked dependency
assumption, mehrsprachige Suche, mehrsprachiges Retrieval, Merging, MMM-Modell, mögliche
Welt, Multilingual, Nachrichtenagentur, Narrative, NLP, Oberflächenform, odds, P-Norm-Modell, Passagen-Retrieval, Phrasen, possible world, probabilistische
Inferenz, Pseudo-Relevance-Feedback, Pseudo-Relevance-Feedback, Query Expansion, query network, Query-Vektor, Query-Vektor, Question Answering, Quote, Rangfolge, Rangfolge, Rangfolge, Rangfolge, Rangfolge, Rangfolge, Regel, Relevance
Feedback, relevance description, Relevanz, Relevanz, Relevanz, Relevanz, Relevanz, Relevanzurteil, retrieval status
value, Retrieval-Status-Wert, Robertson-Sparck-Jones-Formel, Routing, Routing, Routing, Schweizerische Depeschen-Agentur, SGML, Skalarprodukt, Skalarprodukt, Skalarprodukt, Skalarprodukt, Spoken Document Retrieval, Stammformenreduktion, Stammformenreduktion, Synonymmenge, Synonymmenge, Synonymmenge, Tanimoto-Maß, Term-Dokument-Matrix, Term-Dokument-Matrix, Term-Term-Matrix, Term-Term-Matrix, Term-Term-Matrix, Termhäufigkeit, Testkollektion, Testkollektion, Textrepräsentationsschicht, themenspezifischer assoziativer Thesaurus, Thesaurus, Thesaurus, Thesaurus, Trainingsmenge, TREC, TREC, unabhängig, unabhängig, unabhängig, unabhängig, unabhängig, Unabhängigkeit, Unabhängigkeit, Unabhängigkeit, Unabhängigkeit, Unabhängigkeit, Vektorraummodell, Vektorraummodell, Vektorraummodell, Vektorraummodell, Vektorraummodell, Vektorraummodell, Vektorraummodell, Very Large Corpus, vorhersagendes Attribut, vorherzusagendes Attribut, Wahrscheinlichkeitsfunktion, Wahrscheinlichkeitsraum, Web Track, Wertebereich, Wissensgewinnung, XML, Zufallsvariable, Zugehörigkeitsfunktion |
|