Gisle Andersen (red.): Exploring Newspaper Language. Using the web to create and investigate a large corpus of modern Norwegian
PDF

Hvordan referere

Nordgård, T. (2013). Gisle Andersen (red.): Exploring Newspaper Language. Using the web to create and investigate a large corpus of modern Norwegian. Norsk Lingvistisk Tidsskrift, 31(2). Hentet fra https://ojs.novus.no/index.php/NLT/article/view/177

Sammendrag

Utgangspunktet er prosjektet Norsk Aviskorpus (Norwegian Newspaper Corpus, NNC). Som navnet tilsier, består korpuset av norske avistekster som er samlet inn fra 1998 til i dag. Boken inneholder artikler som beskriver korpuset, og eksempler på hvordan det kan brukes i språkvitenskapelig forskning.
Store tekstmengder åpner for nye typer språkstudier. I språkvitenskapelig sammenheng kan man ved hjelp av slike samlinger identifisere nyord og oppdage nye brukskontekster for ord eller uttrykk, leksikografer kan ekstrahere ord som bør inn i ordbøker, eller legge nye bruksmåter til eksisterende ord, språkteknologer kan derivere statistiske språkmodeller til bruk i f.eks. talesyntese eller maskinoversettelse, osv. Som påpekt av Gisle Andersen og Knut Hofland i forordet er avistekster spesielt godt egnet til å bygge en omfattende norsk tekstsamling fordi de har en rimelig balansert tematisk spredning, de er skrevet av profesjonelle skribenter, og de dekker en etter hvert nokså lang periode. Og sist men ikke minst, avistekstene publiseres jevnlig på nett, noe som gjør at dataprogrammer kan laste dem ned daglig uten at utgiveren trenger å bruke ressurser på innsamlingen.
PDF

Forfattere beholder opphavsretten og gir tidsskriftet rett til første publisering av arbeidet. En Creative Commons-lisens (CC BY-SA 4.0) gir samtidig andre rett til å dele arbeidet med henvisning til arbeidets forfatter og at det først ble publisert i dette tidsskriftet.