LaVA  Meklēt korpusā Vārdu biežuma saraksts

Latviešu valodas apguvēju korpuss

Korpusā iekļauti to Latvijas augstākajās mācību iestādes studējošo ārvalstnieku darbi, kuri latviešu valodu apgūst kā svešvalodu pirmo vai otro semestri. Teksti ir automātiski morfoloģiski marķēti, un tajos ir manuāli marķētas valodas apguvēju kļūdas.

Atsauces
Publikācija
R. Dargis, I. Auzina, K. Levane-Petrova, I. Kaija
Quality Focused Approach to a Learner Corpus Development
2020
PDF
Dati
I. Auziņa, I. Kaija, K. Levāne-Petrova, K. Pokratniece, R. Darģis
Latviešu valodas apguvēju korpuss (LaVA)
CLARIN-LV digitālā bibliotēka, 2021
http://hdl.handle.net/20.500.12574/42
Korpusa apjoms 192 000 vārdlietojumu (241 000 tekstvienību)
Datu publicēšanas periods 2018–2021
Izstrādes periods 2018–2021
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots LZP Fundamentālo un lietišķo pētījumu programa (lzp-2018/1-0527)
Mājaslapa http://lava.korpuss.lv/lv/
CLARIN http://hdl.handle.net/20.500.12574/42
Citas publikācijas
I. Kaija and I. Auzina
Data collection for learner corpus of Latvian: copyright and personal data protection
Selected papers from the CLARIN Annual Conference 2019, 41-47, 2020
I. Auzina, I. Kaija, K. Levane-Petrova
Mērķhipotēžu izvirzīšana latviešu valodas apguvēju korpusā
Valoda: nozīme un forma, 11, 7-26, 2020
K. Levane-Petrova, I. Auzina, K. Pokratniece
Latviešu valodas apguvēju korpusa datu ieguves un apstrādes metodoloģijas izstrāde
LiePA, 2020
PDF
I. Auzina, R. Dargis, I. Kaija, K. Levane-Petrova, K. Pokratniece
Valodas korpusu izmantošana latviešu valodas uzdevumu automātiskā ģenerēšanā
Letonica, 264-282, 2022
PDF
I. Auzina, R. Dargis, K. Levane-Petrova
Latviešu valodas apguvēju kļūdu analīze: pareizrakstības kļūdas
Vārds un tā pētīšanas aspekti, 220-227, 2019