vispārīgs (7)
apguvēju (2)
literārs (5)
parlamentārs (1)
diahronisks (2)
specializēts (12)
periodika (3)
latgaliešu (2)
reprezentatīvs (8)
paralēls (1)
teksta (29)
runas (6)
morfoloģija (28)
sintakse (3)
semantika (1)
kļūdas (2)
manuāli pārbaudīts (4)
tīmekļa (2)
Korpusi ar birku runas (6)
BalsuTalka
Balsutalka.lv runas korpuss (Common Voice 14.0)
2023, 136 stundas (817 000 tekstvienību)
Izstrādātāji: LU MII, LU LFMI, LATA
LAMBA
Morfoloģiski marķēts longitudināls bērnu runas korpuss
2015–2017, 34 stundas
Izstrādātāji: LU MII
LRK2013
Latviešu valodas runas atpazīšanas korpuss
2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA
LVMED
Radioloģisko izmeklējumu transkripciju korpuss
2022, 35 stundas (157 000 tekstvienību)
Izstrādātāji: LU MII, RAKUS
Subtitri
Latvijas sabiedrisko mediju subtitru korpuss
2020–2022, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129