FullStack-LV

Daudzslāņu valodas resursu kopa

Daudzslāņu korpuss teksta semantiskai analīzei un sintēzei latviešu valodā. Sintaktiski un semantiski marķētajā datu kopā noteiktās reprezentatīvās proporcijās ievietotas rindkopas no LVK2018. Datu kopa marķēta, izmantojot šādas daudzvalodu reprezentācijas: Universal Dependencies, FrameNet, PropBank, nosauktās entitātes, koreferences, Abstract Meaning Representation.

Atsauces

Publikācija

N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
Proceedings of the 11th International Conference on Language Resources and Evaluation (LREC), 2018

PDF

Dati

N. Grūzītis, L. Pretkalniņa, B. Saulīte, L. Rituma, G. Nešpore-Bērzkalne, P. Paikens, I. Auziņa, A. Znotiņš, K. Levāne-Petrova, R. Darģis
Daudzslāņu valodas resursu kopa (FullStack-LV)
CLARIN-LV digitālā bibliotēka, 2019
http://hdl.handle.net/20.500.12574/5

teksta (36) vispārīgs (11) reprezentatīvs (9) morfoloģija (41) sintakse (3) semantika (1) manuāli pārbaudīts (9)

Korpusa apjoms	13 691 teikums
Datu publicēšanas periods	1991–2018
Izstrādes periods	2017–2019
Izstrādātāji	Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots	ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188)
CLARIN	http://hdl.handle.net/20.500.12574/5
Citas publikācijas	N. Gruzitis, G. Nespore-Berzkalne, B. Saulite Creation of Latvian FrameNet based on Universal Dependencies Proceedings of the International FrameNet Workshop (IFNW), 2018 PDF G. Nespore-Berzkalne, B. Saulite, N. Gruzitis Latvian FrameNet: Cross-Lingual Issues Human Language Technologies - The Baltic Perspective, IOS Press, 2018 PDF DOI N. Gruzitis, R. Dargis, L. Rituma, G. Nespore-Berzkalne, B. Saulite Deriving a PropBank Corpus from Parallel FrameNet and UD Corpora Proceedings of the International FrameNet Workshop 2020: Towards a Global, Multilingual FrameNet, 2020 PDF