2025. gada decembris
18.12.2025.
2025. gada nogalē Korpuss.lv pievienoti vairāki LU Literatūras, folkloras un mākslas institūta un LU Digitālo humanitāro zinātņu centra izstrādātie korpusi un ieviesta jauna sadaļa “Vārdu skices”.
Jauni korpusi
Pievienoti vairāki LU Literatūras, folkloras un mākslas institūta un LU Digitālo humanitāro zinātņu centra izstrādātie korpusi:
- Autobiogrāfiju tekstu korpuss, kurā iekļautas 74 nepublicētas autobiogrāfijas, dzīvesstāsti, atmiņas latviešu valodā.
- LPT teiku korpuss – teikas, kas publicētas Pētera Šmita apkopoto "Latviešu pasaku un teiku" (1925–1937) 13., 14. un 15. sējumā.
Papildinātas versijas
- Uzlabots Latviešu valodas seno tekstu korpuss, ko veido 16.–18. gs. latviešu rakstu avoti un to indeksi. Lai meklēšana korpusā būtu ērtāka, teksti (galvenokārt vārdu saknes) konvertēti nosacītā mūsdienu rakstībā. Izstrādātas arī "Vadlīnijas latviešu seno tekstu (16.–18. gs.) konvertācijai mūsdienu rakstībā", kur aprakstīti izmantotie seno tekstu rakstības konvertācijas principi.
- Papildināts Latviešu valodas sintaktiski marķētais korpuss un Latviešu valodas universālo atkarību korpuss (kārtējā versija 2.17) – 19 580 sintaktiski marķētu teikumu.
Jaunas funkcijas
- Paplašinātas meklēšanas iespējas – vienotajā meklēšanā var meklēt arī pēc CQL izteiksmēm, piem., lai atrastu visus 3. deklinācijas lietvārdus, var izmantot izteiksmi [tag="nc...3"].
- Pievienota sadaļa “Vārdu skices”, kur pieejama informācija par vārda (lietvārda, īpašības vārda, darbības vārda vai apstākļa vārda) tipiskajiem savienojumiem “Līdzsvarotajā mūsdienu latviešu valodas tekstu korpusā”.
- Uz NKK pamata izstrādāts latviešu valodas vārdu biežuma saraksts, tā pirmās 5000 leksēmas sastatītas ar lībiešu pamatleksikonu un iztulkotas latgaliski (sk. Latviešu–latgaliešu–lībiešu vārdu sastatījumu).
Citi jaunumi
- Roberts Darģis aizstāvējis promocijas darbu datorzinātņu doktora grāda iegūšanai “Infrastruktūra latviešu valodas korpusu izstrādei un lietojumiem”.
- Publicēta populārzinātniska publikācija
Auziņa, Ilze, Saulīte, Baiba. 2025. Korpuss.lv dažādiem dzīves gadījumiem. Valodas prakse: vērojumi un ieteikumi. 20 Rīga: Latviešu valodas aģentūra, 43–59.