Korpusi ar birku specializēts (13)

MuLa2022

Mūsdienu latgaliešu tekstu korpuss 2022

2020–2022, 2 milj. vārdlietojumu (2,8 milj. tekstvienību)
Izstrādātāji: RTA, LU MII

Barometrs

Interneta agresivitātes indekss

2011–2022, 26 milj. komentāru (642 milj. tekstvienību)
Izstrādātāji: RSU, LU MII

Disertācijas

Promocijas darbu korpuss

2022, 16,7 milj. vārdlietojumu (23,4 milj. tekstvienību)
Izstrādātāji: LU MII

Emuāri

Latviešu valodas emuāru korpuss

2014–2015, 6,6 milj. vārdlietojumu (8 milj. tekstvienību)
Izstrādātāji: LU MII

LAMBA

Morfoloģiski marķēts longitudināls bērnu runas korpuss

2015–2017, 34 stundas
Izstrādātāji: LU MII

LaRKo

Latviešu valodas runas korpuss

2014, 8 stundas
Izstrādātāji: LU MII

Likumi

Latvijas Republikas tiesību aktu korpuss

2022, 73,9 milj. vārdlietojumu (116,2 milj. tekstvienību)
Izstrādātāji: LU MII

LVMED

Radioloģisko izmeklējumu transkripciju korpuss

2022, 35 stundas (157 000 tekstvienību)
Izstrādātāji: LU MII, RAKUS

MuLa2012

Mūsdienu latgaliešu tekstu korpuss 2012

2011–2013, 1 milj. vārdlietojumu (1,3 milj. tekstvienību)
Izstrādātāji: LU MII, RTA

Pārspriedumi

Skolēnu pārspriedumu korpuss

2018–2021, 185 000 vārdlietojumu (226 000 tekstvienību)
Izstrādātāji: LU MII, LiepU, RTA

Subtitri

Latvijas sabiedrisko mediju subtitru korpuss

2020–2022, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII

Vikipēdija

Vikipēdijas korpuss

2022, 17,9 milj. vārdlietojumu (27,7 milj. tekstvienību)
Izstrādātāji: LU MII

Ziņas

Latvijas ziņu portālu raksti

2022, 357,2 milj. vārdlietojumu (513,5 milj. tekstvienību)
Izstrādātāji: LU MII