Korpusi ar birku vispārīgs (11)

LVTB

Latviešu valodas sintaktiski marķētais korpuss

1991–2022, 18 850 teikumi (318 000 tekstvienību) (v2.14)
Izstrādātāji: LU MII

UDLV-LVTB

Latviešu valodas universālo atkarību korpuss

1991–2022, 18 850 teikumi (318 000 tekstvienību) (v2.14)
Izstrādātāji: LU MII

Tīmeklis2020

Latviešu valodas tīmekļa korpuss

2013–2022, 403,6 milj. vārdlietojumu (492,6 milj. tekstvienību)
Izstrādātāji: LU MII

MuLa2022

Mūsdienu latgaliešu tekstu korpuss 2022

1988–2021, 2 milj. vārdlietojumu (2,8 milj. tekstvienību)
Izstrādātāji: RTA, LU MII

LVK2022

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

2000–2021, 101 milj. vārdlietojumu (123 milj. tekstvienību)
Izstrādātāji: LU MII

LVK2018

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

1991–2018, 10 milj. vārdlietojumu (12 milj. tekstvienību)
Izstrādātāji: LU MII

FullStack-LV

Daudzslāņu valodas resursu kopa

1991–2018, 13 691 teikums
Izstrādātāji: LU MII

LRK2013

Latviešu valodas runas atpazīšanas korpuss

2005–2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA

LiLa

Lietuviešu-latviešu-lietuviešu paralēlo tekstu korpuss

1982–2012, 8 milj. vārdlietojumu
Izstrādātāji: LU MII, VDU

MuLa2012

Mūsdienu latgaliešu tekstu korpuss 2012

1988–2012, 1 milj. vārdlietojumu (1,3 milj. tekstvienību)
Izstrādātāji: LU MII, RTA

Tīmeklis2007

Latviešu valodas tīmekļa korpuss

1991–2005, 99 milj. vārdlietojumu (123 milj. tekstvienību)
Izstrādātāji: LU MII
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
PDF   BibTeX