LATE-sarunas Meklēt korpusā Vārdu biežuma saraksts
LATE sarunu korpuss
Korpusā ir iekļautas privātas sarunas (SIA „Valodu vēstniecība” projekta laikā ierakstītās ikdienas sarunas), intervijas (LU LFMI pētnieku ekspedīciju ieraksti), publisku uzstāšanos, piemēram, konferenču, ieraksti un to atšifrējumi ortogrāfiskajā transkripcijā. Katram audioierakstam ir pievienoti metadati: runātāja dzimums un vecumgrupa, informācija par runas formu – dialogs, monologs, spontāna vai sagatavota runa u. tml.
Atsauces
Publikācija
I. Auzina,
N. Gruzitis,
R. Dargis,
G. Rabante-Busa,
D. Gosko,
J. Vempers,
R. Kivkucans,
A. Znotins
Recent Latvian Speech Corpora for Linguistic Research and Technology Development
Baltic Journal of Modern Computing, 12(4), 646-658, 2024
Recent Latvian Speech Corpora for Linguistic Research and Technology Development
Baltic Journal of Modern Computing, 12(4), 646-658, 2024
Dati
I. Auziņa, R. Darģis, G. Rābante-Buša, I. Timinska-Ļaksa, E. Gailīte, A. Auziņa
LATE sarunu korpuss (LATE-sarunas)
CLARIN-LV digitālā bibliotēka, 2024
http://hdl.handle.net/20.500.12574/113
LATE sarunu korpuss (LATE-sarunas)
CLARIN-LV digitālā bibliotēka, 2024
http://hdl.handle.net/20.500.12574/113
Korpusa apjoms | 44 stundas (429 000 tekstvienību) |
Datu publicēšanas periods | 2012–2024 |
Izstrādes periods | 2021–2024 |
Izstrādātāji | Latvijas Universitātes Matemātikas un informātikas institūts, Latvijas Universitātes Literatūras, folkloras un mākslas institūts |
Finansējuma avots | VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006) |
CLARIN | http://hdl.handle.net/20.500.12574/113 |
Citas publikācijas |