FullStack-LV 

Daudzslāņu valodas resursu kopa

Daudzslāņu korpuss teksta semantiskai analīzei un sintēzei latviešu valodā. Sintaktiski un semantiski marķētajā datu kopā noteiktās reprezentatīvās proporcijās ievietotas rindkopas no LVK2018. Datu kopa marķēta, izmantojot šādas daudzvalodu reprezentācijas: Universal Dependencies, FrameNet, PropBank, nosauktās entitātes, koreferences, Abstract Meaning Representation.

Publikācija, uz kuru atsaukties:
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
PDF
Korpusa apjoms 13 691 teikums
Izstrādes periods 2017–2019
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188)
CLARIN http://hdl.handle.net/20.500.12574/5
Citas publikācijas
N. Gruzitis, G. Nespore-Berzkalne, B. Saulite
Creation of Latvian FrameNet based on Universal Dependencies
2018
PDF
G. Nespore-Berzkalne, B. Saulite, N. Gruzitis
Latvian FrameNet: Cross-Lingual Issues
IOS Press, 2018
PDF DOI
N. Gruzitis, R. Dargis, L. Rituma, G. Nespore-Berzkalne, B. Saulite
Deriving a PropBank Corpus from Parallel FrameNet and UD Corpora
2020
PDF