Ord sett innafra og utafra – en datalingvistisk analyse av nordsamisk
PDF ()

Emneord (Nøkkelord)

morfologi
nordsamisk
korpuslingvistikk
sammensetning
pro­duktivitet
NLP

Hvordan referere

Antonsen, L., & Trosterud, T. (2017). Ord sett innafra og utafra – en datalingvistisk analyse av nordsamisk. Norsk Lingvistisk Tidsskrift, 35(2). Hentet fra http://ojs.novus.no/index.php/NLT/article/view/1416

Sammendrag

Artikkelen presenterer et analyseprogram for nordsamisk løpende tekst, bestående av en morfologisk transduser og en føringsgrammatikk for disambiguering og syntaktisk analyse. Artikkelen drøfter hva programmet kan fortelle oss om nordsamisk grammatikk når det brukes til å analysere et nordsamisk tekstkorpus bestående av til sammen 25 millioner ord. Vi ser på produktiviteten for en del sentrale orddanningsprossesser for substantiv og verb. Sammensetning er langt mer produktiv enn ordavledning, og av de vanligste sammensetningstypene er forledd i nominativ entall den klart mest produktive. Vi bruker også analyseprogrammet for å måle ulike lingvistiske parametre for substantiv og finitte verb, og undersøker hvor sjangeravhengig disse trekkene er. Trass i størrelsen er korpuset ikke godt balansert for å forske på finitte bøyingskategorier, og slik forsking må ta hensyn til dette. Derimot er det liten variasjon mellom sjangerne når det gjelder substantivenes kasusfordeling.

PDF ()

Forfattere beholder opphavsretten og gir tidsskriftet rett til første publisering av arbeidet. En Creative Commons-lisens (CC BY-SA 4.0) gir samtidig andre rett til å dele arbeidet med henvisning til arbeidets forfatter og at det først ble publisert i dette tidsskriftet.