A machine learning based 24-h-technique for an area-wide rainfall retrieval using MSG SEVIRI data over Central Europe : Auf einem maschinellen Lernansatz basierende 24-Stunden-Technik für ein Verfahren zur flächenhaften Erfassung des Niederschlags unter Verwendung von MSG SEVIRI Daten in Mitteleuropa

Das Ziel der vorliegenden Arbeit war die Entwicklung einer neuen 24-Stunden-Methode zur prozessbasierten und quantitativen Niederschlagserfassung, basierend auf MSG SEVIRI Daten und dem maschinellen Lernverfahren Random Forest. Der Fokus lag dabei auf Niederschlagsprozessen im Zusammenhang mit außer...

Full description

Bibliographic Details
Main Author: Kühnlein, Meike
Format: Text
Language:English
Published: Philipps-Universität Marburg 2014
Subjects:
Online Access:https://dx.doi.org/10.17192/z2014.0475
http://archiv.ub.uni-marburg.de/diss/z2014/0475
Description
Summary:Das Ziel der vorliegenden Arbeit war die Entwicklung einer neuen 24-Stunden-Methode zur prozessbasierten und quantitativen Niederschlagserfassung, basierend auf MSG SEVIRI Daten und dem maschinellen Lernverfahren Random Forest. Der Fokus lag dabei auf Niederschlagsprozessen im Zusammenhang mit außertropischen Zyklonen in den Mittelbreiten. Die dafür notwendigen Algorithmen und Ansätze wurden in den folgenden Arbeitspaketen erfolgreich umgesetzt: (WP1) Das ursprünglich für Terra MODIS implementierte Verfahren zur Ableitung von Wolkeneigenschaften SLALOM wurde an die spezifischen Anforderungen des SEVIRI Systems angepasst und erfolgreich übertragen. In einer umfangreichen Validierungsstudie wurden die mit Hilfe von SLALOM abgeleiteten Wolkeneigenschaften effektiver Wolkenradius und optische Wolkendicke mit dem NASA MODIS Wolkenprodukt (MODIS 06) sowie dem optische Wolkendicke Produkt (2B-Tau) von CloudSat verglichen. Die Eignung von SLALOM konnte für eine Region im Nordatlantik sowie über dem europäischen Kontinent gezeigt werden (Kapitel 3). Die abgeleiteten Wolkenparameter dienten als Basis für eine verbesserte Niederschlagserfassung in den Arbeitspaketen WP2 und WP3. (WP2) Ein neues Verfahren für die Zuweisung von Niederschlagsraten wurde für MSG SEVIRI entwickelt. Hierbei diente das maschinelle Lernverfahren Random Forest als grundlegender Vorhersagealgorithmus. Basierend auf den dominierenden Niederschlagsprozessen in Verbindung mit außertropischen Zyklonen erfolgte die Zuweisung der Niederschlagsraten durch einzelne RF Modelle für bereits identifizierte advektiv-stratiforme und konvektive Regenflächen. Die Identifikation der Flächen erfolgte mit Hilfe von Radardaten. Als Prediktorvariablen für die RF Modelle wurden satellitenbasierte Informationen über die Wolkenhöhe, Wolkenoberflächentemperatur, Wolkenphase und Wolkenwasserweg herangezogen. Entsprechend der unterschiedlichen Beleuchtungsbedingungen (Tag, Dämmerung und Nacht) wurde eine passende Auswahl an SEVIRI Spektralkanälen gewählt. Die Entwicklung erfolgte in drei Schritten: Als erstes wurde eine intensive Studie zur Anpassung der einzelnen RF Modelle durchgeführt um die Modellparameter individuell anzupassen. Unter der Verwendung dieser Modellparamter erfolgte im nächsten Schritt das Training der RF Modelle. Diese RF Modelle wurden dann für die Zuweisung der Niederschlagsraten für unabhängige Validierungsdatensätze verwendet und die Ergebnisse gegen Niederschlagsraten des radarbasierten RADOLAN RW Produkts des Deutschen Wetterdienstes verglichen. Die hervorragenden Validierungsergebnisse zu allen Tageszeiten bestätigten die Eignung von Random Forest als Tool für die Ableitung der Niederschlagsraten von MSG SEVIRI Daten (Kapitel 4). (WP3) Ein neues Niederschlagsverfahren das gleichermaßen am Tage, zur Dämmerung und nachts anwendbar ist, wurde für MSG SEVIRI entwickelt. Ziel des Verfahrens ist es Niederschlagsraten für Niederschlagsereignisse in Verbindung mit außertropischen Zyklonen in den Mittelbreiten kontinuierlich zu bestimmen, so dass eine 24 Stunden Vorhersage erzielt wird. Basierend auf den dominanten Niederschlagsprozessen besteht das vorgestellte Verfahren aus drei Schritten, die mit Hilfe individueller Random Forest Modelle nacheinander ausgeführt werden: (i) Identifikation regnender Wolkenbereiche. (ii) Aufteilung dieser Wolkenbereiche in konvektiv und advektiv-stratiform dominierte Wolkenbereiche. (iii) Prozessbasierte Zuweisung der Niederschlagsraten. Wie bereits in WP2 wird der Zusammenhang zwischen satellitenbasierten Informationen überWolkenhöhe, Wolkenoberflächentemperatur, Wolkenphase und Wolkenwasserweg zur Ableitung der Niederschlagsinformationen verwendet und entsprechend der Beleuchtungsbedingungen eine passende Auswahl an Prediktorvariablen als Inputvariablen für die Random Forest Modelle gewählt (Kapitel 5). Das neu entwickelte Niederschlagsverfahren wurde mit Hilfe des radargestützten RADOLAN RW Produkts im Rahmen einer umfangreichen Studie über Deutschland validiert. Die Ergebnisse der Validierungsstudie zeigten eine überzeugende Performanz der neuen Technik sowohl hinsichtlich der identifizierten Niederschlagsfläche, der differenzierten Niederschlagsprozesse sowie der abgeleiteten Niederschlagsraten zu allen Tageszeiten. Dies ermöglicht die Beobachtung und Erfassung des Niederschlags 24 Stunden am Tag. Hervorzuheben sind an dieser Stelle die Anwendbarkeit während der Dämmerung sowie die guten Niederschlagsvorhersagen auf stündlicher Basis. Damit wurde ein Ansatz gefunden, der die Defizite vorheriger optischer Niderschlagsverfahren überwindet und erstmals die Niederschlagserfassung nicht nur konvektiver sondern auch advektiv-stratiform regnender Wolkenbereiche 24 Stunden am Tag ermöglicht. : The aim of the present study was to develop a 24-h-technique for the process-related and quantitative estimation of precipitation in connection with extra-tropical cyclones in the mid-latitudes based on MSG SEVIRI data using the machine learning algorithm random forest. The algorithms and approaches needed were successfully developed and implemented within three working packages: (WP1) The cloud property retrieval SLALOM, first developed for Terra MODIS, was successfully transferred and adapted to the specific requirements of the SEVIRI system and an extensive validation study was carried out. The cloud optical properties retrieved by SLALOM, namely cloud effective radius and cloud optical thickness that were needed for satellitebased rainfall estimation in WP2 and WP3, were compared against the well known and validated NASA MODIS cloud property product (MODIS 06) as well as the cloud optical depth product (2B-TAU) of CloudSat. The suitability of SLALOM has been shown over the North Atlantic and over the European continent (chapter 3). (WP2) A new 24-h-technique for rainfall rate assignment was developed for MSG SEVIRI using the machine learning algorithm random forest as fundamental prediction algorithm. Based on the precipitation processes in connection with extra-tropical cyclones, rainfall rates were assigned to advectivestratiform and convective precipitating areas by means of individual RF models. As predictor variables for the RF models satellite-based information on cloud top height, cloud top temperature, cloud phase and cloud water path were chosen. The different illumination conditions (daytime, twilight and night-time) were taken into account with a proper SEVIRI spectral channel selection as surrogates for theses cloud physical parameters. The development was realised in three steps: First, an extensive tuning study was carried out to customise each of the RF models. Secondly, the RF models were trained using the optimum model parameter values found in the tuning study. Finally, the final RF models were used to predict rainfall rates using an independent validation data set and the results were validated against co-located rainfall rates observed by the RADOLAN RW product of the DWD. The outstanding validation results during all times of the day confirmed the ability of RF as tool for the rainfall rate assignment technique from MSG SEVIRI data (chapter 4). (WP3) A new coherent daytime, twilight and night-time rainfall retrieval was developed for MSG SEVIRI. The technique aims to retrieve rainfall rates for precipitation events in connection with extra-tropical cyclones in the midlatitudes in a continuous manner resulting in a 24 hour prediction. Based on the dominant precipitation processes, the proposed rainfall retrieval consists of three steps which are applied consecutively by means of individual RF models to get the final product: (i) Identification of precipitating cloud areas. (ii) Separation of precipitating areas into predominately convective and advective-stratiform cloud regions. (iii) Individual process-oriented assignment of rainfall rates to these cloud areas. Again, the relationship between cloud top temperature, cloud top height, cloud water path and cloud phase was used to retrieve information about precipitation and according to the illumination conditions, a suitable selection of the predictor variables were taken into account as input to the RF models (chapter 5). The newly developed rainfall retrieval technique was tested in an extensive validation study over Germany using the radar-based RADOLAN RW product as reference data. The validation results show reliable performance of the new technique concerning rain area detection, rain process separation as well as rainfall rate assignment during all times of the day which enables the estimation of precipitation for 24 hours of a day. Hereby, the twilight applicability of the technique as well as good rainfall rate prediction performances even on an hourly basis are particularly remarkable and set this study apart from other rainfall retrievals. For the first time, a 24-h precipitation monitoring becomes possible for precipitating clouds of not only convective but also of advective-stratiform character, opening many areas of application.