NKK | Korpuss.lv

teksta (36) runas (10) vispārīgs (11) specializēts (35) morfoloģija (41) sintakse (3) semantika (1) kļūdas (2) manuāli pārbaudīts (9) diahronisks (7) tīmekļa (3) apguvēju (2) literārs (5) paralēls (1) parlamentārs (1) vēsturisks (2) periodika (5) reprezentatīvs (9) latgaliešu (5) emuāru (3) folklora (3)

Korpusi ar birku reprezentatīvs (9)

LVK2022

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

2000–2021, 101 milj. vārdlietojumu (123 milj. tekstvienību)

Izstrādātāji: LU MII

Vairāk informācijas Meklēt korpusā

LVTB

Latviešu valodas sintaktiski marķētais korpuss

1991–2024, 19 580 teikumu (330 000 tekstvienību) (v2.18)

Izstrādātāji: LU MII

Vairāk informācijas Meklēt korpusā

FullStack-LV

Daudzslāņu valodas resursu kopa

1991–2018, 13 691 teikums

Izstrādātāji: LU MII

Vairāk informācijas

LiLa

Lietuviešu-latviešu-lietuviešu paralēlo tekstu korpuss

1982–2012, 8 milj. vārdlietojumu

Izstrādātāji: LU MII, VDU

Vairāk informācijas Meklēt korpusā

LRK2013

Latviešu valodas runas atpazīšanas korpuss

2005–2013, 100 stundas (1,1 milj. tekstvienību)

Izstrādātāji: LU MII, Tilde, LETA

Vairāk informācijas Meklēt korpusā

LVK2018

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

1991–2018, 10 milj. vārdlietojumu (12 milj. tekstvienību)

Izstrādātāji: LU MII

Vairāk informācijas Meklēt korpusā

LVMED

Radioloģisko izmeklējumu transkripciju korpuss

2010–2022, 35 stundas (157 000 tekstvienību)

Izstrādātāji: LU MII, RAKUS

Vairāk informācijas Meklēt korpusā

MuLa2012

Mūsdienu latgaliešu tekstu korpuss 2012

1988–2012, 1 milj. vārdlietojumu (1,3 milj. tekstvienību)

Izstrādātāji: LU MII, RTU Rēzekne

Vairāk informācijas Meklēt korpusā

UDLV-LVTB

Latviešu valodas universālo atkarību korpuss

1991–2024, 19 580 teikumu (330 000 tekstvienību) (v2.18)

Izstrādātāji: LU MII

Vairāk informācijas Meklēt korpusā

R. Darģis, B. Saulīte
Korpuss.lv – a Versatile Platform for Digital Humanities
Baltic Journal of Modern Computing, 12(4), 2024, pp. 636–645

PDF BibTeX

B. Saulīte, I. Auziņa, R. Darģis
Latvian National Corpora Collection Korpuss.lv | Nacionālā korpusu kolekcija Korpuss.lv
Linguistica Lettica, 31(1), 2023, pp. 202–223

PDF BibTeX

B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129

PDF BibTeX