LVTB  Meklēt korpusā

Latviešu valodas sintaktiski marķētais korpuss

Latviešu valodas sintaktiski marķētais korpuss ir līdzsvarots manuāli gramatiski marķēts tekstu korpuss - LVK2018 apakškopa. Teikumu sintaktiskās struktūras attēlošanai izmantots hibrīds atkarību-frāžu gramatikas modelis.

Atsauces
Publikācija
L. Rituma, B. Saulite, G. Nespore-Berzkalne
Latviešu valodas sintaktiski marķētā korpusa gramatikas modelis
Language: Meaning and Form (The grammar model of Latvian Treebank), 10, 200-216, 2019
Dati
L. Rituma, L. Pretkalniņa, B. Saulīte, G. Nešpore-Bērzkalne, N. Grūzītis
Latviešu valodas sintaktiski marķētais korpuss (LVTB)
CLARIN-LV digitālā bibliotēka, 2022
http://hdl.handle.net/20.500.12574/75
Korpusa apjoms 16 951 teikums (285 425 tekstvienības) (v2.11)
Izstrādes periods 2010–2022
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); VPP "Nacionālā identitāte"; VPP "Humanitāro zinātņu digitālie resursi" (VPP-IZM-DH-2020/1-0001); VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006)
Mājaslapa http://sintakse.korpuss.lv/
CLARIN http://hdl.handle.net/20.500.12574/75
Citas publikācijas
L. Pretkalnina, L. Rituma, B. Saulite
Deriving Enhanced Universal Dependencies from a Hybrid Dependency-Constituency Treebank
Springer, 2018
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
PDF
L. Pretkalnina and L. Rituma
Constructions in Latvian Treebank: the impact of annotation decisions on the dependency parsing performance
IOS Press, 2014
L. Pretkalnina and L. Rituma
Syntactic issues identified developing the Latvian treebank
IOS Press, 2012