LVK2022 Meklēt korpusā Vārdu biežuma saraksts
Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss
Vispārīgs latviešu valodas tekstu korpuss, kurā iekļauti autentiski dažādu žanru mūsdienu (kopš 2000. gada) teksti ar metadatiem. Šī ir korpusa sākotnējā versija (alfa), kas vēl tiks papildināta ar daiļliteratūras datiem.
Korpusa apjoms | 86,5 milj. vārdlietojumu (110 milj. tekstvienību) |
Izstrādes periods | 2019–2022 |
Izstrādātāji | Latvijas Universitātes Matemātikas un informātikas institūts |
Finansējuma avots | Latviešu valodas aģentūra |