vispārīgs (7)
apguvēju (2)
literārs (5)
parlamentārs (1)
diahronisks (2)
specializēts (12)
periodika (3)
latgaliešu (2)
reprezentatīvs (8)
paralēls (1)
teksta (29)
runas (6)
morfoloģija (28)
sintakse (3)
semantika (1)
kļūdas (2)
manuāli pārbaudīts (4)
tīmekļa (2)
Korpusi ar birku specializēts (12)
BalsuTalka
Balsutalka.lv runas korpuss (Common Voice 14.0)
2023, 136 stundas (817 000 tekstvienību)
Izstrādātāji: LU MII, LU LFMI, LATA
Barometrs
Interneta agresivitātes indekss
2011–2022, 26 milj. komentāru (642 milj. tekstvienību)
Izstrādātāji: RSU, LU MII
Disertācijas
Promocijas darbu korpuss
2022, 16,7 milj. vārdlietojumu (23,4 milj. tekstvienību)
Izstrādātāji: LU MII
Emuāri
Latviešu valodas emuāru korpuss
2014–2015, 6,6 milj. vārdlietojumu (8 milj. tekstvienību)
Izstrādātāji: LU MII
LAMBA
Morfoloģiski marķēts longitudināls bērnu runas korpuss
2015–2017, 34 stundas
Izstrādātāji: LU MII
Likumi
Latvijas Republikas tiesību aktu korpuss
2022, 73,9 milj. vārdlietojumu (116,2 milj. tekstvienību)
Izstrādātāji: LU MII
LVMED
Radioloģisko izmeklējumu transkripciju korpuss
2022, 35 stundas (157 000 tekstvienību)
Izstrādātāji: LU MII, RAKUS
Pārspriedumi
Skolēnu pārspriedumu korpuss
2018–2021, 185 000 vārdlietojumu (226 000 tekstvienību)
Izstrādātāji: LU MII, LiepU, RTA
Subtitri
Latvijas sabiedrisko mediju subtitru korpuss
2020–2022, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII
Vikipēdija
Vikipēdijas korpuss
2022, 17,9 milj. vārdlietojumu (27,7 milj. tekstvienību)
Izstrādātāji: LU MII
Ziņas
Latvijas ziņu portālu raksti
2022, 357,2 milj. vārdlietojumu (513,5 milj. tekstvienību)
Izstrādātāji: LU MII
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129