LVTB  Meklēt korpusā

Latviešu valodas sintaktiski marķētais korpuss

Latviešu valodas sintaktiski marķētais korpuss ir līdzsvarots manuāli gramatiski marķēts tekstu korpuss - LVK2018 apakškopa. Teikumu sintaktiskās struktūras attēlošanai izmantots hibrīds atkarību-frāžu gramatikas modelis.

Publikācija, uz kuru atsaukties:
L. Rituma, B. Saulite, G. Nespore-Berzkalne
Latviešu valodas sintaktiski marķētā korpusa gramatikas modelis
Language: Meaning and Form (The grammar model of Latvian Treebank), 10, 200-216, 2019
PDF DOI
Korpusa apjoms 16 803 teikumi (282 167 tekstvienības) (v2.10)
Izstrādes periods 2010–2022
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); VPP "Nacionālā identitāte"; VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001); VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006)
Mājaslapa http://sintakse.korpuss.lv/
CLARIN http://hdl.handle.net/20.500.12574/56
Citas publikācijas
L. Pretkalnina, L. Rituma, B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Springer, 2018
PDF DOI
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
PDF
L. Pretkalnina and L. Rituma
Constructions in Latvian Treebank: the impact of annotation decisions on the dependency parsing performance
IOS Press, 2014
PDF DOI
L. Pretkalnina and L. Rituma
Syntactic issues identified developing the Latvian treebank
IOS Press, 2012
PDF DOI