Subtitri Meklēt korpusā Vārdu biežuma saraksts
Latvijas sabiedrisko mediju subtitru korpuss
Korpusā apkopoti subtitri no dažādām Latvijas sabiedrisko mediju pārraidēm (2015–2020) – raidījumiem, šoviem, filmām un seriāliem. Katrai ir pievienots nosaukums, publicēšanas datums un URL, kur to var noskatīties. Tāpat visiem ierakstiem ir norādīta pārraides audio valoda un tas, vai pārraide ir oriģināli ierakstīta norādītajā valodā vai arī tajā dublēta.
Korpusa apjoms | 1200 stundu (10,8 milj. tekstvienību) |
Datu publicēšanas periods | 2015–2020 |
Izstrādes periods | 2020–2022 |
Izstrādātāji | Latvijas Universitātes Matemātikas un informātikas institūts |
Finansējuma avots | VPP "Letonika latviskas un eiropeiskas sabiedrības attīstībai" (VPP-Letonika-2021/1-0006) |