FullStack-LV 

Daudzslāņu valodas resursu kopa

Daudzslāņu korpuss teksta semantiskai analīzei un sintēzei latviešu valodā. Sintaktiski un semantiski marķētajā datu kopā noteiktās reprezentatīvās proporcijās ievietotas rindkopas no LVK2018. Datu kopa marķēta, izmantojot šādas daudzvalodu reprezentācijas: Universal Dependencies, FrameNet, PropBank, nosauktās entitātes, koreferences, Abstract Meaning Representation.

Atsauces
Publikācija
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC), 2018
PDF
Dati
N. Grūzītis, L. Pretkalniņa, B. Saulīte, L. Rituma, G. Nešpore-Bērzkalne, P. Paikens, I. Auziņa, A. Znotiņš, K. Levāne-Petrova, R. Darģis
Daudzslāņu valodas resursu kopa (FullStack-LV)
CLARIN-LV digitālā bibliotēka, 2019
http://hdl.handle.net/20.500.12574/5
Korpusa apjoms 13 691 teikums
Datu publicēšanas periods 1991–2018
Izstrādes periods 2017–2019
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188)
CLARIN http://hdl.handle.net/20.500.12574/5
Citas publikācijas
N. Gruzitis, G. Nespore-Berzkalne, B. Saulite
Creation of Latvian FrameNet based on Universal Dependencies
Proceedings of the International FrameNet Workshop (IFNW), 2018
PDF
G. Nespore-Berzkalne, B. Saulite, N. Gruzitis
Latvian FrameNet: Cross-Lingual Issues
Human Language Technologies - The Baltic Perspective, IOS Press, 2018
N. Gruzitis, R. Dargis, L. Rituma, G. Nespore-Berzkalne, B. Saulite
Deriving a PropBank Corpus from Parallel FrameNet and UD Corpora
Proceedings of the International FrameNet Workshop 2020: Towards a Global, Multilingual FrameNet, 2020
PDF