vispārīgs (7)
apguvēju (2)
literārs (5)
parlamentārs (1)
diahronisks (2)
specializēts (12)
periodika (3)
latgaliešu (2)
reprezentatīvs (8)
paralēls (1)
teksta (29)
runas (6)
morfoloģija (28)
sintakse (3)
semantika (1)
kļūdas (2)
manuāli pārbaudīts (4)
tīmekļa (2)
Korpusi ar birku reprezentatīvs (8)
LVK2022
Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss
2019–2022, 101 milj. vārdlietojumu (123 milj. tekstvienību)
Izstrādātāji: LU MII
LVTB
Latviešu valodas sintaktiski marķētais korpuss
2010–2023, 17 127 teikumi (289 791 tekstvienība) (v2.12)
Izstrādātāji: LU MII
LiLa
Lietuviešu-latviešu-lietuviešu paralēlo tekstu korpuss
2011–2013, 8 milj. vārdlietojumu
Izstrādātāji: LU MII, VDU
LRK2013
Latviešu valodas runas atpazīšanas korpuss
2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA
LVK2018
Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss
2016–2018, 10 milj. vārdlietojumu (12 milj. tekstvienību)
Izstrādātāji: LU MII
MuLa2012
Mūsdienu latgaliešu tekstu korpuss 2012
2011–2013, 1 milj. vārdlietojumu (1,3 milj. tekstvienību)
Izstrādātāji: LU MII, RTA
UDLV-LVTB
Latviešu valodas universālo atkarību korpuss
2015–2023, 17 127 teikumi (289 791 tekstvienība) (v2.12)
Izstrādātāji: LU MII
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129