Sei D eine Menge von Beispielen oder Dokumenten, A0,...,An eine Menge von Attributen auf den Beispielen, wobei A0,...,Am-1 vorherzusagende Attribute und Am,...,An die vorhersagenden Attribute sind. Sei T die Menge der Tupel, die mit den Attributen aus den Dokumenten gewonnen werden. D bzw. T heißt konsistente Beispielsammlung, wenn für alle s=(s0,...,sn), t=(t0,...,tn)T gilt:
si=ti i{m,...,n}sj=tj j{0,...,m-1}