UDLV-LVTB Meklēt korpusā Vārdu biežuma saraksts
Latviešu valodas universālo atkarību korpuss
Korpuss ir marķēts atbilstoši Universal Dependencies (UD) gramatikas modelim. UDLV dati ir automātiski atvasināti no LVTB datiem.
Detalizētāka informācija par korpusa uzbūvi: Pretkalniņa et al. (2018).
Atsauces
Publikācija
L. Pretkalnina,
L. Rituma,
B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Springer, 2018
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Springer, 2018
Korpusa apjoms | 17 127 teikumi (289 791 tekstvienība) (v2.12) |
Izstrādes periods | 2015–2023 |
Izstrādātāji | Latvijas Universitātes Matemātikas un informātikas institūts |
Finansējuma avots | ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188); VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001); VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006) |
Mājaslapa | http://sintakse.korpuss.lv/ |
CLARIN | http://hdl.handle.net/11234/1-5150 |
Citas publikācijas |
N. Gruzitis,
L. Pretkalnina,
B. Saulite,
L. Rituma,
G. Nespore-Berzkalne,
A. Znotins,
P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU 2018 |