FullStack-LV
Daudzslāņu valodas resursu kopa
Daudzslāņu korpuss teksta semantiskai analīzei un sintēzei latviešu valodā. Sintaktiski un semantiski marķētajā datu kopā noteiktās reprezentatīvās proporcijās ievietotas rindkopas no LVK2018. Datu kopa marķēta, izmantojot šādas daudzvalodu reprezentācijas: Universal Dependencies, FrameNet, PropBank, nosauktās entitātes, koreferences, Abstract Meaning Representation.
Atsauces
Publikācija
N. Gruzitis,
L. Pretkalnina,
B. Saulite,
L. Rituma,
G. Nespore-Berzkalne,
A. Znotins,
P. Paikens
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
Creation of a Balanced State-of-the-Art Multilayer Corpus for NLU
2018
Dati
N. Grūzītis, L. Pretkalniņa, B. Saulīte, L. Rituma, G. Nešpore-Bērzkalne, P. Paikens, I. Auziņa, A. Znotiņš, K. Levāne-Petrova, R. Darģis
Daudzslāņu valodas resursu kopa (FullStack-LV)
CLARIN-LV digitālā bibliotēka, 2019
http://hdl.handle.net/20.500.12574/5
Daudzslāņu valodas resursu kopa (FullStack-LV)
CLARIN-LV digitālā bibliotēka, 2019
http://hdl.handle.net/20.500.12574/5
teksta (30)
vispārīgs (11)
reprezentatīvs (9)
morfoloģija (34)
sintakse (3)
semantika (1)
manuāli pārbaudīts (7)
Korpusa apjoms | 13 691 teikums |
Datu publicēšanas periods | 1991–2018 |
Izstrādes periods | 2017–2019 |
Izstrādātāji | Latvijas Universitātes Matemātikas un informātikas institūts |
Finansējuma avots | ERAF praktiskas ievirzes pētījumu programma (1.1.1.1/16/A/219); ERAF Pēcdoktorantūras pētniecības atbalsts (1.1.1.2/VIAA/1/16/188) |
CLARIN | http://hdl.handle.net/20.500.12574/5 |
Citas publikācijas |
N. Gruzitis,
G. Nespore-Berzkalne,
B. Saulite
Creation of Latvian FrameNet based on Universal Dependencies 2018
G. Nespore-Berzkalne,
B. Saulite,
N. Gruzitis
Latvian FrameNet: Cross-Lingual Issues IOS Press, 2018
N. Gruzitis,
R. Dargis,
L. Rituma,
G. Nespore-Berzkalne,
B. Saulite
Deriving a PropBank Corpus from Parallel FrameNet and UD Corpora 2020 |