Combinação de múltiplas abordagens de classificação para interpretação de imagens hiperespectrais de sensoriamento remoto

=== In the past few decades hyperspectral data analysis has become the main source for classification of remote sensed images. A hyperspectral image is composed of hundreds of spectral channels, where each channel refers to a specific wavelength. Such a large amount of information may lead us to a...

Full description

Bibliographic Details
Main Author: Andrey Bicalho Santos
Other Authors: Arnaldo de Albuquerque Araujo
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2013
Online Access:http://hdl.handle.net/1843/ESBF-97HFYS
Description
Summary:=== In the past few decades hyperspectral data analysis has become the main source for classification of remote sensed images. A hyperspectral image is composed of hundreds of spectral channels, where each channel refers to a specific wavelength. Such a large amount of information may lead us to a deeper investigation of the materials on Earth's surface, and thus, a more precise interpretation of them. Land cover classification is still a challenge task, and producing accurate thematic map is a common goal among researchers. Although each pixel in a hyperspectral image has a detailed spectral information, the joint of both spectral and spatial information is required due to its relations among adjacent pixels. However, joining such information is a widely studied and opened topic in the remote sensing community. In this work we applied meta-learning techniques to combine multiple classification approaches aiming to procuce a more accurate thematic maps. For this purpose, four classification approaches were used in the combination, in which two of them is also a part of this work. In an attempt to maximize the information gain in the combination, each one of the classification approaches has its own feature representation and also uses learning algorithms from different nature. We used two feature representation based on only spectral info and another two based on both spectral-spatial info. Three different learning algorithms were applied. The Support Vector Machines (SVM) and K-Nearest Neighbor (KNN) classifiers were used to classify spectral based data, while Multilayer Perceptron Neural Network (MLP) and, once again, SVM on spectral-spatial based data. Two methods to combine the four classification approaches were proposed. Our firts proposal is based on on Weighted Linear Combination (WLC), in which weights are found by using a Genetic Algorithms (GA) - WLC-GA. The second one, Stacking-SVM, performs a nonlinear combination by means of Stacked Generalization strategy. In order to do it, the SVM learning algorithm with RBF kernel was used. Experiments were carried out with two well-known datasets: Indian Pines and Pavia University. In order to evaluate the robustness of the proposed combiner, experiments using different training sizes on different scenarios were conducted. It was observed that the proposed WLC-GA method achieved promising results on both datasets used, owning the highest accuracy levels among Stacking-SVM and other traditional methods, such as Majority Vote (MV) and Average rules. With only 5% of training samples, the WLC-GA method was able to find optimal, or suboptimal, set of weights which allows an accurate combination of the classification approaches, and hence, a more precise thematic maps, overcoming some drawbacks of other combination methods === Recentemente, a análise de dados hiperespectrais têm sido o principal meio para interpreta ção de imagens de sensoriamento remoto. Uma imagem hiperespectral é composta por centenas de canais, cada um corresponde a uma determinada faixa do espectro eletromagnético. Esse tipo de dados fornece detalhada informação sobre objetos na superfície da terra, podendo nos conduzir a uma profunda investigação, e consequentemente, a uma interpretação mais precisa. A classificação da cobertura terrestre é ainda um desao, e produzir mapas temáticos mais precisos é um objetivo comum entre os pesquisadores. Embora cada pixel na imagem forneça uma rica informação espectral, a união da informação espacial e espectral se faz necessária devido às relações entre pixels adjacentes. Entretanto, combinar esses dois tipos de informações ainda é um tópico aberto e amplamente estudado na comunidade de sensoriamento remoto. Neste trabalho aplicamos técnicas de meta-aprendizado para combinar resultados de múltiplas abordagens de classicação visando produzir mapas temáticos mais precisos. Para isso, quatro abordagens de classicação foram usadas na combinação, sendo que duas delas também fazem parte da proposta deste trabalho. Na tentativa de maximizar o ganho de informação na combinação, cada uma das abordagens de classificação possuem representações de características diferentes e algoritmos de aprendizado (classificadores) de natureza diferentes. Foram usadas duas representações baseando-se apenas na informação espectral e outras duas que se baseiam na união das informações espectral e espacial. Três diferentes tipos de algoritmo de aprendizagem foram aplicados. Os algoritmos Support Vector Machines (SVM) e K-Nearest Neighbor (KNN) foram usados para classificar os dados baseando-se nas representações da informação espectral, enquanto que Multilayer Perceptron Neural Network (MLP) e, novamente, SVM foram usados nas informações do tipo espectral-espacial. Dois métodos para a combinação das quatro abordagens de classicação foram propostos. Nossa primeira proposta é baseada em uma combinação linear ponderada, em que os pesos são encontrados usando Algoritmos Genéticos (Weighted Linear Combination optimized by Genetic Algorithm (WLC-GA)). A segunda, Stacking-SVM, realiza uma combinação não linear por meio da estratégia conhecida como Stacked Generalization. Para isso o algoritmo de aprendizado SVM com kernel Radial Basis Function (RBF) foi utilizado. Experimentos foram realizados em duas bases de dados bem conhecidas: Indian Pines e Pavia University. Com o objetivo de avaliar o comportamento e a robustez dos métodos de combinação, experimentos em diferentes cenários e diferentes conjuntos de treinamento foram conduzidos. Foi observado que o método proposto WLC-GA produz resultados promissores nas duas bases de dados utilizadas, obtendo os maiores índices de acurácia dentre Stacking-SVM e outros métodos tradicionais como Majority Vote (MV) e Average rule. Com apenas 10% de amostras de treino, o método WLCGA foi capaz de encontrar conjuntos de pesos ótimos, ou sub-ótimos, que permitem a obtenção de mapas temáticos mais precisos, superando algumas desvantagens de outros métodos de combinação