Korpusi ar birku diahronisks (6)

Saeima

LR 5.–13. Saeimas sēžu stenogrammu korpuss

1993–2022, 20 milj. vārdlietojumu (24 milj. tekstvienību)
Izstrādātāji: LU MII, RSU

Barometrs

Interneta agresivitātes indekss

2011–2022, 26 milj. komentāru (642 milj. tekstvienību)
Izstrādātāji: RSU, LU MII

Likumi

Latvijas Republikas tiesību aktu korpuss

1990–2022, 73,9 milj. vārdlietojumu (116,2 milj. tekstvienību)
Izstrādātāji: LU MII

Ziņas

Latvijas ziņu portālu raksti

2000–2022, 357,2 milj. vārdlietojumu (513,5 milj. tekstvienību)
Izstrādātāji: LU MII

Subtitri

Latvijas sabiedrisko mediju subtitru korpuss

2015–2020, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII

Disertācijas

Promocijas darbu korpuss

1993–2020, 16,7 milj. vārdlietojumu (23,4 milj. tekstvienību)
Izstrādātāji: LU MII
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
PDF   BibTeX