V okviru projekta "JANES – Jezikoslovna analiza nestandardne slovenščine" http://nl.ijs.si/janes/ spremljajo nekaj najbolj aktivnih forumov in gradijo korpus nelektorirane slovenščine:
Več o korpusu: http://slovenscina2.0.trojina.si/arhiv/ ... 6_2_04.pdfCilj projekta je zgraditi obsežen korpus spletne slovenščine (iz besedil forumov, blogov, komentarjev na novice in tvitov), s pomočjo katerega bomo omogočili empirično podprto jezikoslovno analizo nestandardne spletne slovenščine, izboljšali jezikovnotehnološka orodja za obdelavo besedil, napisanih v nestandardnem jeziku, in izdelali slovarček spletne slovenščine.
Več o pravnih omejitvah: http://slovenscina2.0.trojina.si/arhiv/ ... 6_2_09.pdf
Raziskovalci prosijo za dovoljenje, da korpus spletne slovenščine javno objavijo, zato smo v pogoje uporabe foruma dodali stavek, da se "uporabniki strinjamo, da se naše objavljene vsebine zbirajo in analizirajo tudi za namen izgradnje jezikovnih korpusov kot je korpus spletne slovenščine".