Korpusi ar birku runas (9)

LATE-sarunas

LATE sarunu korpuss

2012–2024, 44 stundas (429 000 tekstvienību)
Izstrādātāji: LU MII, LU LFMI

BalsuTalka

Balsutalka.lv runas korpuss (Common Voice 17.0)

2023–2024, 277 stundas (1,3 milj. tekstvienību)
Izstrādātāji: LU MII, LU LFMI, LATA

BolsuTolka

Bolsutolka.lv runas korpuss (Common Voice 19.0)

2023–2024, 29 stundas (160 000 tekstvienību)
Izstrādātāji: RTA, LU MII, LU LFMI, LATA

fonLATE

LATE fonētiski marķēts runas korpuss

2012–2024, 4 stundas (48 000 tekstvienību)
Izstrādātāji: LU MII

LAMBA

Morfoloģiski marķēts longitudināls bērnu runas korpuss

2015–2017, 34 stundas
Izstrādātāji: LU MII

LATE-mediji

LATE plašsaziņas līdzekļu korpuss

2015–2020, 78 stundas (682 000 tekstvienību)
Izstrādātāji: LU MII

LRK2013

Latviešu valodas runas atpazīšanas korpuss

2005–2013, 100 stundas (1,1 milj. tekstvienību)
Izstrādātāji: LU MII, Tilde, LETA

LVMED

Radioloģisko izmeklējumu transkripciju korpuss

2010–2022, 35 stundas (157 000 tekstvienību)
Izstrādātāji: LU MII, RAKUS

Subtitri

Latvijas sabiedrisko mediju subtitru korpuss

2015–2020, 1200 stundu (10,8 milj. tekstvienību)
Izstrādātāji: LU MII
B. Saulīte, R. Darģis, N. Grūzītis, I. Auziņa, K. Levāne-Petrova, L. Pretkalniņa, L. Rituma, P. Paikens, A. Znotiņš, L. Strankale, K. Pokratniece, I. Poikāns, G. Bārzdiņš, I. Skadiņa, A. Baklāne, V. Saulespurēns, J. Ziediņš.
Latvian National Corpora Collection – Korpuss.lv
Proceedings of the 13th Language Resources and Evaluation Conference (LREC), 2022, pp. 5123–5129
PDF   BibTeX