Hva er viktig for forståelse? Om maskinoversetting fra nordsamisk

Artikkelen presenterer et regelbasert maskinoversettingssystem fra nordsamisk til norsk. Den grammatiske analysen blir gjort med Giellatekno og Divvuns nordsamiske analyseprogram. Vi har skrevet transfer-komponenten (transferleksikon og grammatiske regler) innafor ramme-verket til det åpne maskinove...

Full description

Bibliographic Details
Published in:Oslo Studies in Language
Main Authors: Antonsen, Lene, Trosterud, Trond
Format: Article in Journal/Newspaper
Language:English
Published: University of Oslo Library 2022
Subjects:
Online Access:https://journals.uio.no/osla/article/view/8514
https://doi.org/10.5617/osla.8514
Description
Summary:Artikkelen presenterer et regelbasert maskinoversettingssystem fra nordsamisk til norsk. Den grammatiske analysen blir gjort med Giellatekno og Divvuns nordsamiske analyseprogram. Vi har skrevet transfer-komponenten (transferleksikon og grammatiske regler) innafor ramme-verket til det åpne maskinoversettingssystemet Apertium. Artikkelen inneholder ei evaluering av oversatt tekst for to ulike domener. Tekstene skårer bedre på gjengiving av innholdet enn på godt språk. Ved å systematisere feilene i leksikalske, grammatiske og pragmatiske feil, viser vi at leksikalske feil går mest ut over forståelsen. De andre to feiltypene gir dårlig språk, men har liten innvirkning på forståelsen. Feiltypen det er lettest å forbedre, er den leksikalske, noe som er en lovende konklusjon for utviklinga av et maskinovsersettingssystem for tekstforståing. The article presents a rule-based machine translation system from Northern Sami to Norwegian. The grammatical analysis is done with Giellatekno and Divvun's North Sami program for analysis and translation. We have written the transfer component (transfer lexicon and grammatical rules) within the framework of the open machine translation system Apertium. The article contains an evaluation of translated text for two different domains. The translated texts score better on the presentation of the content than on fluent language. By classifying the errors into lexical, grammatical and pragmatic errors, we show that lexical errors are the most harmful for text comprehension. The other two types of errors give a poor language quality, but they have little effect on comprehension. The type of error that is the easiest to correct is the lexical, which is a promising conclusion for the development of a machine translation system for text comprehension.