Page 1 of 1

Forum Kvarkadabra v korpusu nelektorirane slovenščine

Posted: 4.10.2016 12:00
by saso
Če morda še ne veste, jezikoslovci podrobno preučijo vse, kar objavite na Kvarkadabra forumu!

V okviru projekta "JANES – Jezikoslovna analiza nestandardne slovenščine" http://nl.ijs.si/janes/ spremljajo nekaj najbolj aktivnih forumov in gradijo korpus nelektorirane slovenščine:
Cilj projekta je zgraditi obsežen korpus spletne slovenščine (iz besedil forumov, blogov, komentarjev na novice in tvitov), s pomočjo katerega bomo omogočili empirično podprto jezikoslovno analizo nestandardne spletne slovenščine, izboljšali jezikovnotehnološka orodja za obdelavo besedil, napisanih v nestandardnem jeziku, in izdelali slovarček spletne slovenščine.
Več o korpusu: http://slovenscina2.0.trojina.si/arhiv/ ... 6_2_04.pdf
Več o pravnih omejitvah: http://slovenscina2.0.trojina.si/arhiv/ ... 6_2_09.pdf

Raziskovalci prosijo za dovoljenje, da korpus spletne slovenščine javno objavijo, zato smo v pogoje uporabe foruma dodali stavek, da se "uporabniki strinjamo, da se naše objavljene vsebine zbirajo in analizirajo tudi za namen izgradnje jezikovnih korpusov kot je korpus spletne slovenščine".