UDLV-LVTB Meklēt korpusā Vārdu biežuma saraksts

Latviešu valodas universālo atkarību korpuss

Korpuss ir marķēts atbilstoši Universal Dependencies (UD) gramatikas modelim. UDLV dati ir automātiski atvasināti no LVTB datiem.
Detalizētāka informācija par korpusa uzbūvi: Pretkalniņa et al. (2018).

Atsauces

Publikācija

L. Pretkalnina, L. Rituma, B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Text, Speech, and Dialogue, Springer, 2018

PDF DOI

teksta (36) vispārīgs (11) reprezentatīvs (9) morfoloģija (41) sintakse (3) manuāli pārbaudīts (9)

Korpusa apjoms	19 580 teikumu (330 000 tekstvienību) (v2.18)
Datu publicēšanas periods	1991–2024
Izstrādes periods	2015–2026
Izstrādātāji	Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots	ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188); VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001); VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (LATE – VPP-LETONIKA-2021/1-0006; DigiLATE – VPP-IZM-LETONIKA-2025/1-0004)
Mājaslapa	http://sintakse.korpuss.lv/
CLARIN	http://hdl.handle.net/11234/1-6149
Citas publikācijas	L. Pretkalnina Formāls latviešu valodas gramatikas modelis un tā realizācija mašīnlasāmā sintakses korpusā 2023 PDF N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC), 2018 PDF L. Pretkalnina, L. Rituma, B. Saulite Universal Dependency treebank for Latvian: A pilot Human Language Technologies - The Baltic Perspective, IOS Press, 2016 PDF DOI