Ord sett innafra og utafra – en datalingvistisk analyse av nordsamisk

Lene Antonsen, Trond Trosterud

Sammendrag


Artikkelen presenterer et analyseprogram for nordsamisk løpende tekst, bestående av en morfologisk transduser og en føringsgrammatikk for disambiguering og syntaktisk analyse. Artikkelen drøfter hva programmet kan fortelle oss om nordsamisk grammatikk når det brukes til å analysere et nordsamisk tekstkorpus bestående av til sammen 25 millioner ord. Vi ser på produktiviteten for en del sentrale orddanningsprossesser for substantiv og verb. Sammensetning er langt mer produktiv enn ordavledning, og av de vanligste sammensetningstypene er forledd i nominativ entall den klart mest produktive. Vi bruker også analyseprogrammet for å måle ulike lingvistiske parametre for substantiv og finitte verb, og undersøker hvor sjangeravhengig disse trekkene er. Trass i størrelsen er korpuset ikke godt balansert for å forske på finitte bøyingskategorier, og slik forsking må ta hensyn til dette. Derimot er det liten variasjon mellom sjangerne når det gjelder substantivenes kasusfordeling.


Emneord (Nøkkelord)


morfologi; nordsamisk; korpuslingvistikk; sammensetning; pro­duktivitet; NLP

Fulltekst:

PDF

Innkommende lenker

  • Det er p.t. ingen innkommende lenker.


ISSN 2387-6719

Creative Commons-lisens

Innholdet på dette nettstedet er lisensieret under en Creative Commons Navngivelse-DelPåSammeVilkår 4.0 Internasjonal lisens.