Ord sett innafra og utafra – en datalingvistisk analyse av nordsamisk

Source at http://ojs.novus.no/index.php/NLT/article/view/1416 . Artikkelen presenterer et analyseprogram for nordsamisk løpende tekst, bestående av en morfologisk transduser og en føringsgrammatikk for disambiguering og syntaktisk analyse. Artikkelen drøfter hva programmet kan fortelle oss om nordsa...

Full description

Bibliographic Details
Main Authors: Antonsen, Lene, Trosterud, Trond
Format: Article in Journal/Newspaper
Language:Norwegian Bokmål
Published: Novus forlag 2017
Subjects:
NLP
Online Access:https://hdl.handle.net/10037/13250
Description
Summary:Source at http://ojs.novus.no/index.php/NLT/article/view/1416 . Artikkelen presenterer et analyseprogram for nordsamisk løpende tekst, bestående av en morfologisk transduser og en føringsgrammatikk for disambiguering og syntaktisk analyse. Artikkelen drøfter hva programmet kan fortelle oss om nordsamisk grammatikk når det brukes til å analysere et nordsamisk tekstkorpus bestående av til sammen 25 millioner ord. Vi ser på produktiviteten for en del sentrale orddanningsprossesser for substantiv og verb. Sammensetning er langt mer produktiv enn ordavledning, og av de vanligste sammensetningstypene er forledd i nominativ entall den klart mest produktive. Vi bruker også analyseprogrammet for å måle ulike lingvistiske parametre for substantiv og finitte verb, og undersøker hvor sjangeravhengig disse trekkene er. Trass i størrelsen er korpuset ikke godt balansert for å forske på finitte bøyingskategorier, og slik forsking må ta hensyn til dette. Derimot er det liten variasjon mellom sjangerne når det gjelder substantivenes kasusfordeling.