LATE-sarunas  Meklēt korpusā Vārdu biežuma saraksts

LATE sarunu korpuss

Korpusā ir iekļautas privātas sarunas (SIA „Valodu vēstniecība” projekta laikā ierakstītās ikdienas sarunas), intervijas (LU LFMI pētnieku ekspedīciju ieraksti), publisku uzstāšanos, piemēram, konferenču, ieraksti un to atšifrējumi ortogrāfiskajā transkripcijā. Katram audioierakstam ir pievienoti metadati: runātāja dzimums un vecumgrupa, informācija par runas formu – dialogs, monologs, spontāna vai sagatavota runa u. tml.

Atsauces
Publikācija
I. Auzina, N. Gruzitis, R. Dargis, G. Rabante-Busa, D. Gosko, J. Vempers, R. Kivkucans, A. Znotins
Recent Latvian Speech Corpora for Linguistic Research and Technology Development
Baltic Journal of Modern Computing, 12(4), 646-658, 2024
Dati
I. Auziņa, R. Darģis, G. Rābante-Buša, I. Timinska-Ļaksa, E. Gailīte, A. Auziņa
LATE sarunu korpuss (LATE-sarunas)
CLARIN-LV digitālā bibliotēka, 2024
http://hdl.handle.net/20.500.12574/113
Korpusa apjoms 44 stundas (429 000 tekstvienību)
Datu publicēšanas periods 2012–2024
Izstrādes periods 2021–2024
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts, Latvijas Universitātes Literatūras, folkloras un mākslas institūts
Finansējuma avots VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-LETONIKA-2021/1-0006)
CLARIN http://hdl.handle.net/20.500.12574/113
Citas publikācijas
I. Auzina and G. Rabante-Busa
Sarunvalodai tipiskie fonētiskie līdzekļi: runas korpusa datu analīze
Valoda: nozīme un forma, 15, 7-23, 2024