Lai latviešu valodai būtu līdzvērtīgas iespējas interneta vidē, salīdzinot ar citām valodām, nepieciešams veidot latviešu valodas korpusu. Valodas korpusu praktiskā lietojamība ir plaša - tos izmanto izglītībā, valodas apmācībā, tekstu tulkošanā, vārdnīcu veidošanā, valodniecības pētījumos, kā arī citās sfērās. Literatūras korpuss ir viena no valodas korpusa apakškopām, un tas aptver visas valodas korpusa funkcionālās īpašības un prasības.
Pilnvērtīgam korpusam ir nepieciešama ne tikai apjomīga tekstu kolekcija, bet arī vienota koncepcija, programmrīki un darba vide, kas nodrošinātu:
- tekstu glabāšanu standartizētā, strukturizētā un apstrādāšanai ērtā formātā (šī pilotprojekta mērķis);
- navigācijas un meklēšanas iespējas pētnieciskai un jebkurai citai izziņai;
- korpusam specifiskas iespējas: vārdformu biežuma analīzi, vārdu konkordances, vārdu savienojumu analīzi u.c.;
- interfeisu ar korpusu un tā funkcijām (interneta vidē) gan profesionālajiem lietotājiem, gan publiskajiem interesentiem.
Strukturētais un ar funkcionālajiem lietojumiem nodrošinātais latviešu literatūras korpuss kalpos gan par filoloģijas pētniecības objektu dažādiem zinātniskajiem nolūkiem, gan arī kā izziņas līdzeklis skolēniem, studentiem un citiem interesentiem.