LaVA  Meklēt korpusā Vārdu biežuma saraksts

Latviešu valodas apguvēju korpuss

Korpusā iekļauti to Latvijas augstākajās mācību iestādes studējošo ārvalstnieku darbi, kuri latviešu valodu apgūst kā svešvalodu pirmo vai otro semestri. Teksti ir automātiski morfoloģiski marķēti, un tajos ir manuāli marķētas valodas apguvēju kļūdas.

Publikācija, uz kuru atsaukties:
R. Dargis, I. Auzina, K. Levane-Petrova, I. Kaija
Quality Focused Approach to a Learner Corpus Development
2020
PDF
Korpusa apjoms 192 000 vārdlietojumu (241 000 tekstvienību)
Izstrādes periods 2018–2021
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots LZP Fundamentālo un lietišķo pētījumu programa (lzp-2018/1-0527)
Mājaslapa http://lava.korpuss.lv/lv/
CLARIN http://hdl.handle.net/20.500.12574/49
Citas publikācijas
I. Kaija and I. Auzina
Data collection for learner corpus of Latvian: copyright and personal data protection
Selected papers from the CLARIN Annual Conference 2019, 41-47, 2020
PDF DOI
I. Auzina, I. Kaija, K. Levane-Petrova
Mērķhipotēžu izvirzīšana latviešu valodas apguvēju korpusā
Valoda: nozīme un forma, 11, 7-26, 2020
PDF DOI
K. Levane-Petrova, I. Auzina, K. Pokratniece
Latviešu valodas apguvēju korpusa datu ieguves un apstrādes metodoloģijas izstrāde
LiePA, 2020
PDF
I. Auzina, R. Dargis, I. Kaija, K. Levane-Petrova, K. Pokratniece
Valodas korpusu izmantošana latviešu valodas uzdevumu automātiskā ģenerēšanā
Letonica, 264-282, 2022
PDF