FullStack-LV 

Daudzslāņu valodas resursu kopa

Daudzslāņu korpuss teksta semantiskai analīzei un sintēzei latviešu valodā. Sintaktiski un semantiski marķētajā datu kopā noteiktās reprezentatīvās proporcijās ievietotas rindkopas no LVK2018. Datu kopa marķēta, izmantojot šādas daudzvalodu reprezentācijas: Universal Dependencies, FrameNet, PropBank, nosauktās entitātes, koreferences, Abstract Meaning Representation.

Atsauces
Publikācija
N. Gruzitis, L. Pretkalnina, B. Saulite, L. Rituma, G. Nespore-Berzkalne, A. Znotins, P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
PDF
Dati
N. Grūzītis, L. Pretkalniņa, B. Saulīte, L. Rituma, G. Nešpore-Bērzkalne, P. Paikens, I. Auziņa, A. Znotiņš, K. Levāne-Petrova, R. Darģis
Daudzslāņu valodas resursu kopa (FullStack-LV)
CLARIN-LV digitālā bibliotēka, 2019
http://hdl.handle.net/20.500.12574/5
Korpusa apjoms 13 691 teikums
Izstrādes periods 2017–2019
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188)
CLARIN http://hdl.handle.net/20.500.12574/5
Citas publikācijas
N. Gruzitis, G. Nespore-Berzkalne, B. Saulite
Creation of Latvian FrameNet based on Universal Dependencies
2018
PDF
G. Nespore-Berzkalne, B. Saulite, N. Gruzitis
Latvian FrameNet: Cross-Lingual Issues
IOS Press, 2018
N. Gruzitis, R. Dargis, L. Rituma, G. Nespore-Berzkalne, B. Saulite
Deriving a PropBank Corpus from Parallel FrameNet and UD Corpora
2020
PDF