ZURÜCK

Abb. 30: Das Zipf'sche Gesetz am Beispiel des Brown- und des LOB-Korpus'


  Rang Anzahl    R*A/100000  Term
-----------------------------------
     1 138323       1.3832  the
     2  72159       1.4432  of
     3  56750       1.7025  and
     4  52941       2.1176  to
     5  46523       2.3262  a
     6  42603       2.5562  in
     7  22177       1.5524  that
     8  21210       1.6968  is
     9  20501       1.8451  was
    10  19587       1.9587  it
   100   2043       2.0430  years
   500    394       1.9700  program
  1000    207       2.0700  jones
  2000    105       2.1000  granted
  3000     67       2.0100  agencies
  4000     47       1.8800  embassy
  5000     36       1.8000  vale
 10000     14       1.4000  poisoning
 12034     11       1.3237  yell

Minimum: 1.24982  
Maximum: 2.55618 
Mittelwert: 1.697 
Varianz: 0.077 
Standardabweichung: 0.277

In der dritten Spalte steht das Produkt aus Rang und Häufigkeit (Anzahl) dividiert durch 100000. Bei gleicher Häufigkeit wurden die Rangplätze nach alphabetischer Sortierung zugewiesen.

Die statistischen Angaben beziehen sich auf die vollständige Liste aller Wörter, die häufiger als 10 mal auftreten.


ZURÜCK

© 2000 / HTML-Version 14. 1. 2000: R. Ferber