Subtitri  Meklēt korpusā Vārdu biežuma saraksts

Latvijas sabiedrisko mediju subtitru korpuss

Korpusā apkopoti subtitri no dažādām Latvijas sabiedrisko mediju pārraidēm (2015–2020) – raidījumiem, šoviem, filmām un seriāliem. Katrai ir pievienots nosaukums, publicēšanas datums un URL, kur to var noskatīties. Tāpat visiem ierakstiem ir norādīta pārraides audio valoda un tas, vai pārraide ir oriģināli ierakstīta norādītajā valodā vai arī tajā dublēta.

Korpusa apjoms 1200 stundu (10,8 milj. tekstvienību)
Izstrādes periods 2020–2022
Izstrādātāji Latvijas Universitātes Matemātikas un informātikas institūts
Finansējuma avots VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-Letonika-2021/1-0006)