teksta (30)
runas (9)
vispārīgs (11)
specializēts (28)
morfoloģija (33)
sintakse (3)
semantika (1)
kļūdas (2)
manuāli pārbaudīts (6)
diahronisks (6)
tīmekļa (2)
apguvēju (2)
literārs (4)
paralēls (1)
parlamentārs (1)
vēsturisks (2)
periodika (5)
reprezentatīvs (9)
latgaliešu (3)
emuāru (2)
Korpusi ar birku runas (9)
Kārtot pēc:
LRK2013
Latviešu valodas runas atpazīšanas korpuss
2005–2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA
LVMED
Radioloģisko izmeklējumu transkripciju korpuss
2010–2022, 35 stundas (157 000 tekstvienību)
Izstrādātāji: LU MII, RAKUS
LATE-sarunas
LATE sarunu korpuss
2012–2024, 35 stundas (347 000 tekstvienību)
Izstrādātāji: LU MII, LU LFMI
LAMBA
Morfoloģiski marķēts longitudināls bērnu runas korpuss
2015–2017, 34 stundas
Izstrādātāji: LU MII
Subtitri
Latvijas sabiedrisko mediju subtitru korpuss
2015–2020, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII
LATE-mediji
LATE plašsaziņas līdzekļu korpuss
2015–2020, 50 stundas (433 000 tekstvienību)
Izstrādātāji: LU MII
BalsuTalka
Balsutalka.lv runas korpuss (Common Voice 17.0)
2023–2024, 277 stundas (1,3 milj. tekstvienību)
Izstrādātāji: LU MII, LU LFMI, LATA
BolsuTolka
Bolsutolka.lv runas korpuss (Common Voice 17.0)
2023–2024, 24 stundas (130 000 tekstvienību)
Izstrādātāji: RTA, LU MII, LU LFMI, LATA
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129