LATE-mediji  Meklēt korpusā Vārdu biežuma saraksts

LATE plašsaziņas līdzekļu korpuss

Korpusā ir iekļauti Latvijas sabiedrisko mediju raidījumu ieraksti – gan spontāna, gan sagatavota (galvenokārt lasīta) runa. Dati pierakstīti latviešu literārās valodas ortogrāfijā, ievērojot arī interpunkcijas principus.

Korpusa apjoms 50 stundas (433 000 tekstvienību)
Datu publicēšanas periods 2015–2020
Izstrādes periods 2021–2024
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006)