LATE-mediji Meklēt korpusā Vārdu biežuma saraksts
LATE plašsaziņas līdzekļu korpuss
Korpusā ir iekļauti Latvijas sabiedrisko mediju raidījumu ieraksti – gan spontāna, gan sagatavota (galvenokārt lasīta) runa. Dati pierakstīti latviešu literārās valodas ortogrāfijā, ievērojot arī interpunkcijas principus.
Korpusa apjoms | 50 stundas (433 000 tekstvienību) |
Datu publicēšanas periods | 2015–2020 |
Izstrādes periods | 2021–2024 |
Izstrādātāji | Latvijas Universitātes Matemātikas un informātikas institūts |
Finansējuma avots | VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006) |