Multivariabel Analyse av Havstrømmer i Barentshavet

Analyser for parameterreduksjon og prediksjon er utført på et hindcast datasett fra et bestemt område i Barentshavet. Tre analysemetoder, PCA, PLSR og GPR utføres på et utvalg scenarioer og datamengder. Principal Component Analysis (PCA) brukes på data fra to forskjellige romlige dimensjoner for å u...

Full description

Bibliographic Details
Main Author: Tørresen, Merethe
Other Authors: Skjetne, Roger, Scibilia, Francesco
Format: Master Thesis
Language:English
Published: NTNU 2019
Subjects:
Online Access:http://hdl.handle.net/11250/2622984
id ftntnutrondheimi:oai:ntnuopen.ntnu.no:11250/2622984
record_format openpolar
institution Open Polar
collection NTNU Open Archive (Norwegian University of Science and Technology)
op_collection_id ftntnutrondheimi
language English
description Analyser for parameterreduksjon og prediksjon er utført på et hindcast datasett fra et bestemt område i Barentshavet. Tre analysemetoder, PCA, PLSR og GPR utføres på et utvalg scenarioer og datamengder. Principal Component Analysis (PCA) brukes på data fra to forskjellige romlige dimensjoner for å utforske parameterreduksjon og relasjoner mellom vind- og strømdata. De viser at havstrøm gjennom vannkolonnen er sterkt korrelert og velegnet for parameterreduksjon. Partial Least Squares Regression (PLSR) er et ananalyseverktøy som ligner PCA, men algoritmen er trent med hensyn til en spesifisert respons. Metoden utføres på datasett med ulike mengder data, hvor målinger er tatt hver time i 2, 5 og 10 år. To PLSR-teknikker brukes, estimering og prognoser. Estimering av strøm gjennom vannkolonnen utføres basert på prediktorvariabler som inneholder vind og havstrømmålinger på 0m, 10m og 20m. Det resulterende estimatet er ganske bra i de øverste lagene, men kvaliteten reduseres raskt mot bunnen. Dette kan observeres tydelig i tidsserier av rekonstruerte data og Mean Squared Error (MSE). Fra en dybde på rundt 100-150m og til bunnen, er estimatet ganske dårlig. Men det kan kanskje være godt nok til å brukes til prediksjon av drift av isberg, siden de flyter i overflaten og vanligvis har kjøl på max 200m. PLSR brukes også til prognoser. Disse er basert på historiske data gjennom hele vannsøylen. Prognosen er utført for en time fram i tid, og siden strømmen ikke endres veldig mye i løpet av en time, er resultatene fra disse analysene veldig gode. De viser at antall år med treningsdata inkludert, har en mindre enn forventet effekt på MSE og de resulterende tidsseriene. En tredje metode, Gaussian Process Regression (GPR) blir også utført på dataene. Denne metoden er ganske forskjellig fra PCA og PLSR, da den er ulineær og den lar dataene i mye høyere grad snakke for seg selv. GPR er brukt til estimering, og gir et mye bedre resultat enn ved PLSR. Havstrømmer mot bunnen får imidlertid fortsatt en moderat feil, og beregningstiden er betydelig, selv for relativt små datasett. Å kombinere metoder ved å utføre PCA og deretter GPR for å redusere beregningstiden foreslås. Analyses for parameter reduction and prediction are performed on a hindcast dataset from a specific location in the Barents Sea. Three methods, PCA, PLSR and GPR are applied to different scenarios, and a selection of data amounts. Principal Com- ponent Analysis (PCA) are applied to data from two different spatial dimensions in order to explore parameter reduction and relations in the wind- and current data. It shows that current data through the water depth are highly correlated and well suited for parameter reduction, while data in the horizontal direction are not. Partial Least Squares Regression (PLSR) is an analysis tool that is very similar to PCA, but the algorithm is trained with more consideration towards specified re- sponse variables. The method is performed on datasets including different amounts of data with measurements every hour for 2, 5 and 10 years. Two techniques are used, estimation and forecasting. Estimation of currents through the water column are done based on the predictor variables wind and currents at 0m, 10m and 20m. The resulting estimate is quite good in upper current layers, while its quality decrease fast towards the bottom. This is clearly seen in timeseries of reconstructed data and Mean Squared Error (MSE). At a depth of around 100m to 150m, the estimation is quite poor. However, as icebergs are floating in the surface, the es- timation might be good enough to help with iceberg drift predictions. PLSR is also used for forecasting, which is based on historic data through the entire water column. The forecast is made for one hour into the future, and as currents do not change very much in an hour, the results from these analyses are very good. They show that the number of years of training data included has a smaller effect than expected on the MSE and the resulting timeseries. A third method, Gaussian Process Regression (GPR) is applied to the data. This method is quite different from PCA and PLSR, as it is non-linear and it lets the data speak more for itself. GPR is used for estimation, and gives a much better result than PLSR. However, bottom currents still have a moderate error and the computation time is significant, even for small datasets. Combining methods by performing PCA and then GPR to reduce computation time is proposed.
author2 Skjetne, Roger
Scibilia, Francesco
format Master Thesis
author Tørresen, Merethe
spellingShingle Tørresen, Merethe
Multivariabel Analyse av Havstrømmer i Barentshavet
author_facet Tørresen, Merethe
author_sort Tørresen, Merethe
title Multivariabel Analyse av Havstrømmer i Barentshavet
title_short Multivariabel Analyse av Havstrømmer i Barentshavet
title_full Multivariabel Analyse av Havstrømmer i Barentshavet
title_fullStr Multivariabel Analyse av Havstrømmer i Barentshavet
title_full_unstemmed Multivariabel Analyse av Havstrømmer i Barentshavet
title_sort multivariabel analyse av havstrømmer i barentshavet
publisher NTNU
publishDate 2019
url http://hdl.handle.net/11250/2622984
long_lat ENVELOPE(7.516,7.516,62.907,62.907)
geographic Barents Sea
Kjøl
geographic_facet Barents Sea
Kjøl
genre Barents Sea
Barentshav*
genre_facet Barents Sea
Barentshav*
op_relation http://hdl.handle.net/11250/2622984
_version_ 1766370727729037312
spelling ftntnutrondheimi:oai:ntnuopen.ntnu.no:11250/2622984 2023-05-15T15:39:14+02:00 Multivariabel Analyse av Havstrømmer i Barentshavet Tørresen, Merethe Skjetne, Roger Scibilia, Francesco 2019 http://hdl.handle.net/11250/2622984 eng eng NTNU http://hdl.handle.net/11250/2622984 Master thesis 2019 ftntnutrondheimi 2019-11-01T12:24:00Z Analyser for parameterreduksjon og prediksjon er utført på et hindcast datasett fra et bestemt område i Barentshavet. Tre analysemetoder, PCA, PLSR og GPR utføres på et utvalg scenarioer og datamengder. Principal Component Analysis (PCA) brukes på data fra to forskjellige romlige dimensjoner for å utforske parameterreduksjon og relasjoner mellom vind- og strømdata. De viser at havstrøm gjennom vannkolonnen er sterkt korrelert og velegnet for parameterreduksjon. Partial Least Squares Regression (PLSR) er et ananalyseverktøy som ligner PCA, men algoritmen er trent med hensyn til en spesifisert respons. Metoden utføres på datasett med ulike mengder data, hvor målinger er tatt hver time i 2, 5 og 10 år. To PLSR-teknikker brukes, estimering og prognoser. Estimering av strøm gjennom vannkolonnen utføres basert på prediktorvariabler som inneholder vind og havstrømmålinger på 0m, 10m og 20m. Det resulterende estimatet er ganske bra i de øverste lagene, men kvaliteten reduseres raskt mot bunnen. Dette kan observeres tydelig i tidsserier av rekonstruerte data og Mean Squared Error (MSE). Fra en dybde på rundt 100-150m og til bunnen, er estimatet ganske dårlig. Men det kan kanskje være godt nok til å brukes til prediksjon av drift av isberg, siden de flyter i overflaten og vanligvis har kjøl på max 200m. PLSR brukes også til prognoser. Disse er basert på historiske data gjennom hele vannsøylen. Prognosen er utført for en time fram i tid, og siden strømmen ikke endres veldig mye i løpet av en time, er resultatene fra disse analysene veldig gode. De viser at antall år med treningsdata inkludert, har en mindre enn forventet effekt på MSE og de resulterende tidsseriene. En tredje metode, Gaussian Process Regression (GPR) blir også utført på dataene. Denne metoden er ganske forskjellig fra PCA og PLSR, da den er ulineær og den lar dataene i mye høyere grad snakke for seg selv. GPR er brukt til estimering, og gir et mye bedre resultat enn ved PLSR. Havstrømmer mot bunnen får imidlertid fortsatt en moderat feil, og beregningstiden er betydelig, selv for relativt små datasett. Å kombinere metoder ved å utføre PCA og deretter GPR for å redusere beregningstiden foreslås. Analyses for parameter reduction and prediction are performed on a hindcast dataset from a specific location in the Barents Sea. Three methods, PCA, PLSR and GPR are applied to different scenarios, and a selection of data amounts. Principal Com- ponent Analysis (PCA) are applied to data from two different spatial dimensions in order to explore parameter reduction and relations in the wind- and current data. It shows that current data through the water depth are highly correlated and well suited for parameter reduction, while data in the horizontal direction are not. Partial Least Squares Regression (PLSR) is an analysis tool that is very similar to PCA, but the algorithm is trained with more consideration towards specified re- sponse variables. The method is performed on datasets including different amounts of data with measurements every hour for 2, 5 and 10 years. Two techniques are used, estimation and forecasting. Estimation of currents through the water column are done based on the predictor variables wind and currents at 0m, 10m and 20m. The resulting estimate is quite good in upper current layers, while its quality decrease fast towards the bottom. This is clearly seen in timeseries of reconstructed data and Mean Squared Error (MSE). At a depth of around 100m to 150m, the estimation is quite poor. However, as icebergs are floating in the surface, the es- timation might be good enough to help with iceberg drift predictions. PLSR is also used for forecasting, which is based on historic data through the entire water column. The forecast is made for one hour into the future, and as currents do not change very much in an hour, the results from these analyses are very good. They show that the number of years of training data included has a smaller effect than expected on the MSE and the resulting timeseries. A third method, Gaussian Process Regression (GPR) is applied to the data. This method is quite different from PCA and PLSR, as it is non-linear and it lets the data speak more for itself. GPR is used for estimation, and gives a much better result than PLSR. However, bottom currents still have a moderate error and the computation time is significant, even for small datasets. Combining methods by performing PCA and then GPR to reduce computation time is proposed. Master Thesis Barents Sea Barentshav* NTNU Open Archive (Norwegian University of Science and Technology) Barents Sea Kjøl ENVELOPE(7.516,7.516,62.907,62.907)