Eesti keele spontaanse kõne foneetilise korpuse sagedussõnastik on koostatud korpuse v.1.0.5 (20.06.2019, doi:10.15155/1-00-0000-0000-0000-001A3L) versiooni põhjal, kui korpuses oli märgendatud 685 750 sõna (89 tundi ja 18 minutit kõnet). Vt korpuse kohta lähemalt
Korpus lemmatiseeriti ESTMORF morfoloogilise analüsaatoriga ( -- vt ka sõnaliikide loendit).
Tabelis EKSKFK_sagedussonastik_2019-06-20.txt on esitatud 1000 sagedasema sõna lemma, sõnaliik ning sagedus.
The frequency table of the 1000 most frequent words in the Phonetic Corpus of Estonian Spontaneous Speech is based on a the v.1.0.5 (20.06.2019, doi:10.15155/1-00-0000-0000-0000-001A3L) version of the corpus, which has a total of 685 750 words (89 h 18 minutes of speech). For more info about the corpus:
The words were lemmatisized using ESTMORF morphological analyzer (see ( for more info, inc. the list of word classes).
The table in the file EKSKFK_sagedussonastik_2019-06-20.txt presents the 1000 most frequent lemmas, their word class and frequency.