Time Series Generation and Classification of MODIS Data for Land Cover Mapping

Processes of the Earth’s surface occur at different scales of time and intensity. Climate in particular determines the activity and seasonal development of vegetation. These dynamics are predominantly driven by temperature in the humid mid-latitudes and by the availability of water in semi-arid regi...

Full description

Bibliographic Details
Main Author: Colditz, Rene Roland
Format: Doctoral Thesis
Language:English
Published: 2007
Subjects:
Online Access:https://opus.bibliothek.uni-wuerzburg.de/frontdoor/index/index/docId/2221
http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-25908
https://nbn-resolving.org/urn:nbn:de:bvb:20-opus-25908
https://opus.bibliothek.uni-wuerzburg.de/files/2221/Dissertation_Colditz_neu.pdf
id ndltd-uni-wuerzburg.de-oai-opus.bibliothek.uni-wuerzburg.de-2221
record_format oai_dc
collection NDLTD
language English
format Doctoral Thesis
sources NDLTD
topic Zeitreihe
Automatische Klassifikation
Klassifikations- und Regressionsbaum
Fernerkundung
ddc:550
spellingShingle Zeitreihe
Automatische Klassifikation
Klassifikations- und Regressionsbaum
Fernerkundung
ddc:550
Colditz, Rene Roland
Time Series Generation and Classification of MODIS Data for Land Cover Mapping
description Processes of the Earth’s surface occur at different scales of time and intensity. Climate in particular determines the activity and seasonal development of vegetation. These dynamics are predominantly driven by temperature in the humid mid-latitudes and by the availability of water in semi-arid regions. Human activities are a modifying parameter for many ecosystems and can become the prime force in well-developed regions with an intensively managed environment. Accounting for these dynamics, i.e. seasonal dynamics of ecosystems and short- to long-term changes in land-cover composition, requires multiple measurements in time. With respect to the characterization of the Earth surface and its transformation due to global warming and human-induced global change, there is a need for appropriate data and methods to determine the activity of vegetation and the change of land cover. Space-borne remote sensing is capable of monitoring the activity and development of vegetation as well as changes of the land surface. In many instances, satellite images are the only means to comprehensively assess the surface characteristics of large areas. A high temporal frequency of image acquisition, forming a time series of satellite data, can be employed for mapping the development of vegetation in space and time. Time series allow for detecting and assessing changes and multi-year transformation processes of high and low intensity, or even abrupt events such as fire and flooding. The operational processing of satellite data and automated information-extraction techniques are the basis for consistent and continuous long-term product generation. This provides the potential for directly using remote-sensing data and products for analyzing the land surface in relation to global warming and global change, including deforestation and land transformation. This study aims at the development of an advanced approach to time-series generation using data-quality indicators. A second goal focuses on the application of time series for automated land-cover classification and update, using fractional cover estimates to accommodate for the comparatively coarse spatial resolution. Requirements of this study are the robustness and high accuracy of the approaches as well as the full transferability to other regions and datasets. In this respect, the developments of this study form a methodological framework, which can be filled with appropriate modules for a specific sensor and application. In order to attain the first goal, time-series compilation, a stand-alone software application called TiSeG (Time Series Generator) has been developed. TiSeG evaluates the pixel-level quality indicators provided with each MODIS land product. It computes two important data-availability indicators, the number of invalid pixels and the maximum gap length. Both indices are visualized in time and space, indicating the feasibility of temporal interpolation. The level of desired data quality can be modified spatially and temporally to account for distinct environments in a larger study area and for seasonal differences. Pixels regarded as invalid are either masked or interpolated with spatial or temporal techniques. === Prozesse an der Erdoberfläche finden auf verschiedenen Intensitätsskalen und in unterschiedlichen Zeiträumen statt. Dabei steuert das Klima die saisonale Aktivität der Vegetation, welche in den humiden Mittelbreiten hauptsächlich durch die Temperatur bestimmt wird. In semi-ariden Gebieten hingegen ist die Verfügbarkeit von Wasser als Haupteinflussfaktor für das Pflanzenwachstum zu betrachten. Andererseits greift auch der Mensch modifizierend in das Ökosystem ein. Dies gilt insbesondere für die stark besiedelten und intensiver genutzten Räume der Erde, in denen die Umwelt nahezu ausschließlich durch den Menschen gesteuert wird. Zur Beurteilung dieser Dynamiken, sowohl der natürlichen saisonalen Muster als auch der kurz- bis langfristigen Änderungen der Landschaft, ist die Aufnahme einer Vielzahl von Messungen über eine längere Periode erforderlich. Insbesondere im Zusammenhang mit der Charakterisierung der Landoberfläche und deren Veränderung im Rahmen der Erderwärmung aber auch des wachsenden Einflusses des Menschen auf die Umwelt besteht somit ein Bedarf an geeigneten Daten und Methoden zur Bestimmung der jährlichen Aktivität von Vegetationseinheiten und der wiederholbaren Kartierung der Landoberfläche. Die Satellitenfernerkundung ist in der Lage, durch Messung von Strahlung die Aktivität der Vegetation zu bestimmen sowie die Klassifikation der Landoberfläche abzuleiten. In vielen Fällen sind Satellitenaufnahmen die einzige Möglichkeit, große Flächen der Erde umfassend und einheitlich zu beurteilen. Dabei kann durch eine Vielzahl aufeinander folgender Aufnahmen, d.h. eine Zeitreihe aus Satellitendaten, die Entwicklung der Vegetation in Raum und Zeit beobachtet werden. Zeitreihen bieten das Potential, Veränderungen der Landoberfläche über mehrere Jahre zu dokumentieren und somit Prozesse sowohl hoher als auch niedriger Intensität abzuleiten. Neben diesen gerichteten Veränderungen können auch plötzliche Ereignisse, wie z.B. Hochwasser oder Brände, mit Zeitreihen erfasst und in Bezug auf normale Bedingungen ausgewertet werden. Insbesondere die operationelle Prozessierung der Satellitendaten und die automatisierte Ableitung von Informationen bilden die Basis für konsistente und kontinuierliche Produkte über längere Zeiträume. Somit besteht das Potential, die Ergebnisse direkt in die Erforschung der Landoberfläche und deren Veränderung, z.B. durch die Erderwärmung, Walddegradation, oder die Nutzung vormals natürlicher Flächen, einzubinden. Diese Dissertation befasst sich mit der Entwicklung von Methoden zur Zeitreihengenerierung unter Verwendung der Qualitätsindikatoren einzelner Aufnahmen. Ein zweites Ziel der Arbeit ist die Anwendung der optimierten Zeitreihen zur automatisierten und reproduzierbaren Kartierung der Landoberfläche, wobei unscharfe Klassifikationsverfahren zur genaueren Charakterisierung der räumlich nur grob aufgelösten Daten eingesetzt werden. Damit erfordert diese Arbeit sowohl Robustheit der eingesetzten Methoden als auch eine hohe Genauigkeit der Ergebnisse. Ebenso maßgeblich ist die Übertragbarkeit der Verfahren, einerseits auf verschiedene Regionen als auch auf verschiedene Datensätze. Daher sind die hier vorgenommenen Entwicklungen als ein Rahmen zu verstehen, der je nach Sensor oder Anwendung mit verschiedenen Modulen besetzt werden kann. Zum Erreichen des ersten Zieles, der Zeitreihengenerierung, wurde das eigenständige Softwareprodukt TiSeG (Time Series Generator) entwickelt. TiSeG dient der Auswertung der Qualitätsindikatoren die mit jedem MODIS-Produkt für terrestrische Applikationen zur Verfügung gestellt werden. Dabei werden in Bezug auf die Generierung von Zeitreihen zwei Indizes der Datenverfügbarkeit ermittelt: erstens die Anzahl der ungültigen Pixel und zweitens die längste zeitliche Datenlücke. Beide Indizes werden räumlich und zeitlich dargestellt und geben so dem Bearbeiter die Information, ob mit den aktuellen Qualitätsangaben die Generierung einer sinnvollen Zeitreihe durch zeitliche Dateninterpolation möglich ist. Die Qualitätseinstellungen können sowohl zeitlich als auch räumlich angepasst werden. Eine zeitliche Änderung kann beispielsweise für bestimmte Jahreszeiten sinnvoll sein. Räumlich unterschiedliche Qualitätseinstellungen eignen sich für größere Untersuchungsgebiete mit differenzierten physisch-geographischen Charakteristika. Als ungültig betrachtete Pixel können durch einen Fehlwert maskiert oder durch zeitliche und räumliche Interpolation neu errechnet werden. Das zweite Ziel dieser Arbeit ist die automatische Klassifikation von Zeitreihen. Hierzu wurde ein modulares Verfahren der überwachten Klassifikation entwickelt. Aufgrund der groben räumlichen Auflösung von MODIS-Daten erschien es besonders wichtig, ein unscharfes Verfahren aufzubauen, das die Heterogenität der Klassen in vielen Räumen besser abbilden kann. Dabei wurde der Klassenanteil eines jeden Pixel ermittelt. Die Schlüsselmodule zur erfolgreichen Durchführung der Klassifikation waren eine Multiskalenanalyse und die geeignete Auswahl von Merkmalen und Stichproben zum Trainieren des Klassifikators. Der eigentliche Klassifikationsschritt wurde durch eine Erweiterung des Entscheidungsbaumklassifikators durchgeführt. Diese Erweiterung kann in den bestehenden Rahmen von „random forest“ und „bagging“ (ein Akronym für „bootstrap aggregation“) eingeordnet werden. Jedoch wurden die dort angewendeten Verfahren in dieser Arbeit zu einem deutlich strategischen Vorgehen modifiziert, d.h. es wurde auf das Prinzip der Zufallsauswahl und der Wiederverwendung von Stichproben (Ziehen mit Zurücklegen) verzichtet. In Bezug auf die anfangs geschilderten Anforderungen, Robustheit, Genauigkeit und Übertragbarkeit, kann an dieser Stelle festgestellt werden, dass sich die in dieser Arbeit entwickelten Methodiken als geeignet erwiesen haben. Insbesondere die Übertragbarkeit auf andere Regionen und Daten war eine große Herausforderung, da hierdurch kein zusätzliches a priori Wissen außer den Trainingsdaten zum überwachten Klassifizieren benutzt werden konnte. Die regionale Übertragbarkeit ist für mehrere Untersuchungsräume mit sehr unterschiedlichen physisch-geographischen Eigenschaften demonstriert worden. Obwohl TiSeG derzeit nicht direkt auf andere Datensätze außer MODIS angewendet wird, bildet die zugrunde liegende Idee der Auswertung von Qualitätsdaten zur Zeitreihengenerierung sowie der entwickelte Rahmen der Software die Möglichkeit der Erweiterung, z.B. auf Daten von MERIS und auf das zukünftige VIIRS-Instrument. Des Weiteren ist das grundlegende Konzept der Qualitätsauswertung in einem separaten Prozessor für AVHRR NDVI Daten zu einem vollautomatischen, schrittweise interpolierenden Verfahren erweitert worden. Das in dieser Arbeit vorgestellte modulare Klassifikationsverfahren erfordert keine besonderen Eingangsdaten, wie z.B. bestimmte MODIS Zeitreihen. Dies wurde durch den Gebrauch unterschiedlicher Eingangsdaten zur Generierung der Maßzahlen bei der Sensitivitätsanalyse bestätigt. Damit ist der Prozess weder auf MODIS-Zeitserien noch auf Zeitreihen generell beschränkt. Der gesamte automatische Klassifikationsprozess ist datengesteuert, sowohl was die zu klassifizierenden Daten als auch die Trainingsdaten angeht. Die Unschärfe in den Ergebnissen ermöglicht die detaillierte Auswertung der Klassenzusammensetzung, was ein besonders wichtiger Aspekt bei grob aufgelösten Datenprodukten und deren Anpassungsfähigkeit auf andere Anwendungen ist.
author Colditz, Rene Roland
author_facet Colditz, Rene Roland
author_sort Colditz, Rene Roland
title Time Series Generation and Classification of MODIS Data for Land Cover Mapping
title_short Time Series Generation and Classification of MODIS Data for Land Cover Mapping
title_full Time Series Generation and Classification of MODIS Data for Land Cover Mapping
title_fullStr Time Series Generation and Classification of MODIS Data for Land Cover Mapping
title_full_unstemmed Time Series Generation and Classification of MODIS Data for Land Cover Mapping
title_sort time series generation and classification of modis data for land cover mapping
publishDate 2007
url https://opus.bibliothek.uni-wuerzburg.de/frontdoor/index/index/docId/2221
http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-25908
https://nbn-resolving.org/urn:nbn:de:bvb:20-opus-25908
https://opus.bibliothek.uni-wuerzburg.de/files/2221/Dissertation_Colditz_neu.pdf
work_keys_str_mv AT colditzreneroland timeseriesgenerationandclassificationofmodisdataforlandcovermapping
AT colditzreneroland zeitreihengenerierungundklassifikationvonmodisdatenzurlandbedeckungsklassifikation
_version_ 1719245178230800384
spelling ndltd-uni-wuerzburg.de-oai-opus.bibliothek.uni-wuerzburg.de-22212019-09-07T16:24:59Z Time Series Generation and Classification of MODIS Data for Land Cover Mapping Zeitreihengenerierung und Klassifikation von MODIS Daten zur Landbedeckungsklassifikation Colditz, Rene Roland Zeitreihe Automatische Klassifikation Klassifikations- und Regressionsbaum Fernerkundung ddc:550 Processes of the Earth’s surface occur at different scales of time and intensity. Climate in particular determines the activity and seasonal development of vegetation. These dynamics are predominantly driven by temperature in the humid mid-latitudes and by the availability of water in semi-arid regions. Human activities are a modifying parameter for many ecosystems and can become the prime force in well-developed regions with an intensively managed environment. Accounting for these dynamics, i.e. seasonal dynamics of ecosystems and short- to long-term changes in land-cover composition, requires multiple measurements in time. With respect to the characterization of the Earth surface and its transformation due to global warming and human-induced global change, there is a need for appropriate data and methods to determine the activity of vegetation and the change of land cover. Space-borne remote sensing is capable of monitoring the activity and development of vegetation as well as changes of the land surface. In many instances, satellite images are the only means to comprehensively assess the surface characteristics of large areas. A high temporal frequency of image acquisition, forming a time series of satellite data, can be employed for mapping the development of vegetation in space and time. Time series allow for detecting and assessing changes and multi-year transformation processes of high and low intensity, or even abrupt events such as fire and flooding. The operational processing of satellite data and automated information-extraction techniques are the basis for consistent and continuous long-term product generation. This provides the potential for directly using remote-sensing data and products for analyzing the land surface in relation to global warming and global change, including deforestation and land transformation. This study aims at the development of an advanced approach to time-series generation using data-quality indicators. A second goal focuses on the application of time series for automated land-cover classification and update, using fractional cover estimates to accommodate for the comparatively coarse spatial resolution. Requirements of this study are the robustness and high accuracy of the approaches as well as the full transferability to other regions and datasets. In this respect, the developments of this study form a methodological framework, which can be filled with appropriate modules for a specific sensor and application. In order to attain the first goal, time-series compilation, a stand-alone software application called TiSeG (Time Series Generator) has been developed. TiSeG evaluates the pixel-level quality indicators provided with each MODIS land product. It computes two important data-availability indicators, the number of invalid pixels and the maximum gap length. Both indices are visualized in time and space, indicating the feasibility of temporal interpolation. The level of desired data quality can be modified spatially and temporally to account for distinct environments in a larger study area and for seasonal differences. Pixels regarded as invalid are either masked or interpolated with spatial or temporal techniques. Prozesse an der Erdoberfläche finden auf verschiedenen Intensitätsskalen und in unterschiedlichen Zeiträumen statt. Dabei steuert das Klima die saisonale Aktivität der Vegetation, welche in den humiden Mittelbreiten hauptsächlich durch die Temperatur bestimmt wird. In semi-ariden Gebieten hingegen ist die Verfügbarkeit von Wasser als Haupteinflussfaktor für das Pflanzenwachstum zu betrachten. Andererseits greift auch der Mensch modifizierend in das Ökosystem ein. Dies gilt insbesondere für die stark besiedelten und intensiver genutzten Räume der Erde, in denen die Umwelt nahezu ausschließlich durch den Menschen gesteuert wird. Zur Beurteilung dieser Dynamiken, sowohl der natürlichen saisonalen Muster als auch der kurz- bis langfristigen Änderungen der Landschaft, ist die Aufnahme einer Vielzahl von Messungen über eine längere Periode erforderlich. Insbesondere im Zusammenhang mit der Charakterisierung der Landoberfläche und deren Veränderung im Rahmen der Erderwärmung aber auch des wachsenden Einflusses des Menschen auf die Umwelt besteht somit ein Bedarf an geeigneten Daten und Methoden zur Bestimmung der jährlichen Aktivität von Vegetationseinheiten und der wiederholbaren Kartierung der Landoberfläche. Die Satellitenfernerkundung ist in der Lage, durch Messung von Strahlung die Aktivität der Vegetation zu bestimmen sowie die Klassifikation der Landoberfläche abzuleiten. In vielen Fällen sind Satellitenaufnahmen die einzige Möglichkeit, große Flächen der Erde umfassend und einheitlich zu beurteilen. Dabei kann durch eine Vielzahl aufeinander folgender Aufnahmen, d.h. eine Zeitreihe aus Satellitendaten, die Entwicklung der Vegetation in Raum und Zeit beobachtet werden. Zeitreihen bieten das Potential, Veränderungen der Landoberfläche über mehrere Jahre zu dokumentieren und somit Prozesse sowohl hoher als auch niedriger Intensität abzuleiten. Neben diesen gerichteten Veränderungen können auch plötzliche Ereignisse, wie z.B. Hochwasser oder Brände, mit Zeitreihen erfasst und in Bezug auf normale Bedingungen ausgewertet werden. Insbesondere die operationelle Prozessierung der Satellitendaten und die automatisierte Ableitung von Informationen bilden die Basis für konsistente und kontinuierliche Produkte über längere Zeiträume. Somit besteht das Potential, die Ergebnisse direkt in die Erforschung der Landoberfläche und deren Veränderung, z.B. durch die Erderwärmung, Walddegradation, oder die Nutzung vormals natürlicher Flächen, einzubinden. Diese Dissertation befasst sich mit der Entwicklung von Methoden zur Zeitreihengenerierung unter Verwendung der Qualitätsindikatoren einzelner Aufnahmen. Ein zweites Ziel der Arbeit ist die Anwendung der optimierten Zeitreihen zur automatisierten und reproduzierbaren Kartierung der Landoberfläche, wobei unscharfe Klassifikationsverfahren zur genaueren Charakterisierung der räumlich nur grob aufgelösten Daten eingesetzt werden. Damit erfordert diese Arbeit sowohl Robustheit der eingesetzten Methoden als auch eine hohe Genauigkeit der Ergebnisse. Ebenso maßgeblich ist die Übertragbarkeit der Verfahren, einerseits auf verschiedene Regionen als auch auf verschiedene Datensätze. Daher sind die hier vorgenommenen Entwicklungen als ein Rahmen zu verstehen, der je nach Sensor oder Anwendung mit verschiedenen Modulen besetzt werden kann. Zum Erreichen des ersten Zieles, der Zeitreihengenerierung, wurde das eigenständige Softwareprodukt TiSeG (Time Series Generator) entwickelt. TiSeG dient der Auswertung der Qualitätsindikatoren die mit jedem MODIS-Produkt für terrestrische Applikationen zur Verfügung gestellt werden. Dabei werden in Bezug auf die Generierung von Zeitreihen zwei Indizes der Datenverfügbarkeit ermittelt: erstens die Anzahl der ungültigen Pixel und zweitens die längste zeitliche Datenlücke. Beide Indizes werden räumlich und zeitlich dargestellt und geben so dem Bearbeiter die Information, ob mit den aktuellen Qualitätsangaben die Generierung einer sinnvollen Zeitreihe durch zeitliche Dateninterpolation möglich ist. Die Qualitätseinstellungen können sowohl zeitlich als auch räumlich angepasst werden. Eine zeitliche Änderung kann beispielsweise für bestimmte Jahreszeiten sinnvoll sein. Räumlich unterschiedliche Qualitätseinstellungen eignen sich für größere Untersuchungsgebiete mit differenzierten physisch-geographischen Charakteristika. Als ungültig betrachtete Pixel können durch einen Fehlwert maskiert oder durch zeitliche und räumliche Interpolation neu errechnet werden. Das zweite Ziel dieser Arbeit ist die automatische Klassifikation von Zeitreihen. Hierzu wurde ein modulares Verfahren der überwachten Klassifikation entwickelt. Aufgrund der groben räumlichen Auflösung von MODIS-Daten erschien es besonders wichtig, ein unscharfes Verfahren aufzubauen, das die Heterogenität der Klassen in vielen Räumen besser abbilden kann. Dabei wurde der Klassenanteil eines jeden Pixel ermittelt. Die Schlüsselmodule zur erfolgreichen Durchführung der Klassifikation waren eine Multiskalenanalyse und die geeignete Auswahl von Merkmalen und Stichproben zum Trainieren des Klassifikators. Der eigentliche Klassifikationsschritt wurde durch eine Erweiterung des Entscheidungsbaumklassifikators durchgeführt. Diese Erweiterung kann in den bestehenden Rahmen von „random forest“ und „bagging“ (ein Akronym für „bootstrap aggregation“) eingeordnet werden. Jedoch wurden die dort angewendeten Verfahren in dieser Arbeit zu einem deutlich strategischen Vorgehen modifiziert, d.h. es wurde auf das Prinzip der Zufallsauswahl und der Wiederverwendung von Stichproben (Ziehen mit Zurücklegen) verzichtet. In Bezug auf die anfangs geschilderten Anforderungen, Robustheit, Genauigkeit und Übertragbarkeit, kann an dieser Stelle festgestellt werden, dass sich die in dieser Arbeit entwickelten Methodiken als geeignet erwiesen haben. Insbesondere die Übertragbarkeit auf andere Regionen und Daten war eine große Herausforderung, da hierdurch kein zusätzliches a priori Wissen außer den Trainingsdaten zum überwachten Klassifizieren benutzt werden konnte. Die regionale Übertragbarkeit ist für mehrere Untersuchungsräume mit sehr unterschiedlichen physisch-geographischen Eigenschaften demonstriert worden. Obwohl TiSeG derzeit nicht direkt auf andere Datensätze außer MODIS angewendet wird, bildet die zugrunde liegende Idee der Auswertung von Qualitätsdaten zur Zeitreihengenerierung sowie der entwickelte Rahmen der Software die Möglichkeit der Erweiterung, z.B. auf Daten von MERIS und auf das zukünftige VIIRS-Instrument. Des Weiteren ist das grundlegende Konzept der Qualitätsauswertung in einem separaten Prozessor für AVHRR NDVI Daten zu einem vollautomatischen, schrittweise interpolierenden Verfahren erweitert worden. Das in dieser Arbeit vorgestellte modulare Klassifikationsverfahren erfordert keine besonderen Eingangsdaten, wie z.B. bestimmte MODIS Zeitreihen. Dies wurde durch den Gebrauch unterschiedlicher Eingangsdaten zur Generierung der Maßzahlen bei der Sensitivitätsanalyse bestätigt. Damit ist der Prozess weder auf MODIS-Zeitserien noch auf Zeitreihen generell beschränkt. Der gesamte automatische Klassifikationsprozess ist datengesteuert, sowohl was die zu klassifizierenden Daten als auch die Trainingsdaten angeht. Die Unschärfe in den Ergebnissen ermöglicht die detaillierte Auswertung der Klassenzusammensetzung, was ein besonders wichtiger Aspekt bei grob aufgelösten Datenprodukten und deren Anpassungsfähigkeit auf andere Anwendungen ist. 2007 doctoralthesis doc-type:doctoralThesis application/pdf https://opus.bibliothek.uni-wuerzburg.de/frontdoor/index/index/docId/2221 urn:nbn:de:bvb:20-opus-25908 https://nbn-resolving.org/urn:nbn:de:bvb:20-opus-25908 https://opus.bibliothek.uni-wuerzburg.de/files/2221/Dissertation_Colditz_neu.pdf eng info:eu-repo/semantics/openAccess