Prediction of Vessel Activity in Arctic Waters using Supervised Learning Methods

Raske miljøendringer i Arktis, i form av varmere temperaturer og smelting av havis, fører til lengre navigasjonssesonger og alternative transportveier. Økt sjøtrafikk i de tøffe klimaforholdene fører til en høyere sannsynlighet for at ulykker inntreffer, hvilket truer mennesker og miljø. En grundig...

Full description

Bibliographic Details
Main Author: Kiær, Beatrice
Other Authors: Utne, Ingrid Bouwer, Jones, Alun
Format: Master Thesis
Language:English
Published: NTNU 2022
Subjects:
Online Access:https://hdl.handle.net/11250/3026222
Description
Summary:Raske miljøendringer i Arktis, i form av varmere temperaturer og smelting av havis, fører til lengre navigasjonssesonger og alternative transportveier. Økt sjøtrafikk i de tøffe klimaforholdene fører til en høyere sannsynlighet for at ulykker inntreffer, hvilket truer mennesker og miljø. En grundig forståelse av aktivitetsutviklingen er nødvendig for å redusere disse truslene. Slik innsikt er imidlertid vanskelig å oppnå gjennom tidligere erfaringer da Arktis opprinnelig har vært utilgjengelig. Samtidig tilbyr dagens teknologi nye muligheter gjennom programvare og høykvalitetsdata fra sensorer og satellitter. Formålet med denne masteroppgaven er å undersøke hvordan maskinlæring (ML) og trafikkdata fra fartøy i sanntid kan brukes til å identifisere aktivitetstrender i Arktis og hvordan disse trendene henger sammen med arktiske klimaendringer, miljø og økologi. Metoden som presenteres følger stegene i en typisk ML-sekvens fra allokering og prosessering av data til implementering av to ML-modeller. I denne oppgaven er Arktis representert som et utvalgt område i Barentshavet. Den aktuelle perioden er mellom 2015 og 2021. Flere datakilder ble undersøkt for potensielle inngangsverdier til ML modellene, hvorav data om havtemperatur, havis, dybde, avstand til land og fiskefangst var de mest anvendelige i forhold til filstørrelse, tilgang og utstrekning. Dataene ble individuelt analysert og bearbeidet, og det endelige treningsdatasettet ble komponert gjennom aggregering til et forhåndsdefinert rutenett i tid og rom. Utgangsverdien for aktivitet ble definert fra trafikkdata gjennom to ulike case-studier. Treningsdataene fra hver case-studie ble brukt til å bygge en Random Forest (RF) modell og en Extreme Gradient Boosting (XGBoost) modell. Den første case-studien undersøkte predikering av aktivitet gjennom tilstedeværelse av fartøy, og den andre estimerte tettheten av fartøy innenfor en bestemt type skipsaktivitet. Resultatene viser at modellene hadde tilnærmet lik læringsprosess og predikerte med tilfredsstillende ...