Korpusi ar birku vispārīgs (6)

LVK2018

Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss

2016–2018, 10 milj. vārdlietojumu (12 milj. tekstvienību)
Izstrādātāji: LU MII

LVTB

Latviešu valodas sintaktiski marķētais korpuss

2010–2022, 16 803 teikumi (282 167 tekstvienības) (v2.10)
Izstrādātāji: LU MII

FullStack-LV

Daudzslāņu valodas resursu kopa

2017–2019, 13 691 teikums
Izstrādātāji: LU MII

Hugo.lv

Hugo.lv paralēlie korpusi

2018, 10,5 milj. vārdlietojumu
Izstrādātāji: KISC

LRK2013

Latviešu valodas runas atpazīšanas korpuss

2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA

UDLV-LVTB

Latviešu valodas universālo atkarību korpuss

2015–2022, 16 951 teikums (285 425 tekstvienību) (v2.11)
Izstrādātāji: LU MII