LVK2022  Meklēt korpusā Vārdu biežuma saraksts

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

Vispārīgs latviešu valodas tekstu korpuss, kurā iekļauti autentiski dažādu žanru mūsdienu (kopš 2000. gada) teksti ar metadatiem. Šī ir korpusa sākotnējā versija (alfa), kas vēl tiks papildināta ar daiļliteratūras datiem.

Korpusa apjoms 86,5 milj. vārdlietojumu (110 milj. tekstvienību)
Izstrādes periods 2019–2022
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots Latviešu valodas aģentūra