teksta (30)
runas (9)
vispārīgs (11)
specializēts (28)
morfoloģija (33)
sintakse (3)
semantika (1)
kļūdas (2)
manuāli pārbaudīts (6)
diahronisks (6)
tīmekļa (2)
apguvēju (2)
literārs (4)
paralēls (1)
parlamentārs (1)
vēsturisks (2)
periodika (5)
reprezentatīvs (9)
latgaliešu (3)
emuāru (2)
Korpusi ar birku runas (9)
Kārtot pēc:
BolsuTolka
Bolsutolka.lv runas korpuss (Common Voice 19.0)
2023–2024, 29 stundas (160 000 tekstvienību)
Izstrādātāji: RTA, LU MII, LU LFMI, LATA
BalsuTalka
Balsutalka.lv runas korpuss (Common Voice 17.0)
2023–2024, 277 stundas (1,3 milj. tekstvienību)
Izstrādātāji: LU MII, LU LFMI, LATA
LATE-sarunas
LATE sarunu korpuss
2012–2024, 35 stundas (347 000 tekstvienību)
Izstrādātāji: LU MII, LU LFMI
LATE-mediji
LATE plašsaziņas līdzekļu korpuss
2015–2020, 50 stundas (433 000 tekstvienību)
Izstrādātāji: LU MII
LVMED
Radioloģisko izmeklējumu transkripciju korpuss
2010–2022, 35 stundas (157 000 tekstvienību)
Izstrādātāji: LU MII, RAKUS
Subtitri
Latvijas sabiedrisko mediju subtitru korpuss
2015–2020, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII
LAMBA
Morfoloģiski marķēts longitudināls bērnu runas korpuss
2015–2017, 34 stundas
Izstrādātāji: LU MII
LRK2013
Latviešu valodas runas atpazīšanas korpuss
2005–2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129