Summary: | O uso de imagens provenientes de sensores remotos, tal como sistemas acoplados em aviões e satélites, é cada vez mais frequente, uma vez que permite o monitoramento continuo e periódico ao longo do tempo por meio de diversas observações de uma mesma região, por vezes ampla ou de difícil acesso. Essa ferramenta tem se mostrado importante e significativa em aplicações como o mapeamento de solo e fronteiras; acompanhamento de áreas de desmatamento, queimadas e de produção agrícola. Para gerar resultados interpretáveis ao usuário final, essas imagens devem ser processadas. Atualmente, o método de classificação por máxima verossimilhança é o mais empregado para classificação de imagens multiespectrais de sensores remotos, entretanto, por se tratar de uma técnica supervisionada, seus resultados dependem extensivamente da qualidade do conjunto de treinamento, utilizado para definir os parâmetros do método. A seleção de um bom conjunto de treinamento é um processo custoso e inviabiliza a automação da classificação para diversas imagens. O método de classificação por máxima verossimilhança é também paramétrico e portanto exitem algumas suposições quanto a distribuição dos dados que devem ser atendidas, caso contrário a aplicação do método pode gerar resultados ruins. Tendo em vista essas desvantagens do método da máxima verossimilhança, este trabalho propõe um novo método para a classificação de imagens multiespectrais provenientes de sensores remotos de forma que o procedimento seja autônomo, veloz e preciso, minimizando dessa forma os possíveis erros humanos inseridos em etapas intermediárias do processo, tal como a definição de conjuntos de treinamento. O método aqui proposto pertence ao conjunto das redes neurais artificiais (RNAs) e é denominado growing neural gas (GNG). Este método baseia-se no aprendizado não supervisionado de padrões \"naturais\" dentro de um conjunto de dados por meio da criação e adaptação de uma rede mínima de neurônios. Os resultados gerados a partir da classificação pela RNA foram comparados com os métodos mais utilizados na literatura atual, sendo eles o método da máxima verossimilhança e o método k-means. A partir da biblioteca espectral ASTER, mantida e criada parcialmente pela NASA, foram realizadas várias repetições do experimento, que consiste em classificar os dados de acordo com as diferentes classes existentes, e para cada uma destas repetições calculou-se uma medida de acurácia, denominada índice kappa, além do tempo de execução de cada método, de forma que suas médias foram comparadas via intervalo de confiança gerados por bootstrap não paramétrico. Também investigou-se como a análise de componentes principais (ACP), técnica utilizada para reduzir a dimensão dos dados e consequentemente o custo computacional, pode influenciar no desempenho dos métodos, tanto em sua qualidade de classificação quanto em relação ao tempo de execução. Os resultados mostram que o método proposto é superior nos dois aspectos estudados, acurácia e tempo de execução, para a maioria dos fatores aplicados. Mostra-se ainda um exemplo de aplicação prática em que uma imagem multiespectral de satélite não satisfaz as pré-suposições estabelecidas para o uso do método da máxima verossimilhança e verifica-se a diferença entre os métodos com relação a qualidade final da imagem classificada.
===
The use of images from remote sensors, such as coupled systems in airplanes and satellites, are increasingly being used because they allow continuous and periodic surveillance over time through several observations of some particular area, sometimes large or difficult to access. This sort of image has shown an important and meaningful participation in applications such as soil and borders mapping; surveillance of deforestation, forest fires and agricultural production areas. To generate interpretable results to the end user, these images must be processed. Currently, the maximum likelihood classification method is the most used for multispectral image classification of remote sensing, however, because it is a supervised technique, the results depend extensively on the quality of the training set, used to define the parameters of the method. Selecting a good training set is a costly process and prevents the automation of classification for different images. The maximum likelihood classification method is also parametric, and therefore, some assumptions about the distribution of the data must be met, otherwise the application of the method can generate bad results. In view of these disadvantages of the maximum likelihood method, this dissertation proposes a new, autonomous, fast and accurate method for multispectral remote sensing imagery classification thereby minimizing the possible human errors inserted at intermediate stages of the process, such as the definition of training sets. The method proposed here belongs to the set of artificial neural networks (ANN) and is called growing neural gas (GNG). This method is based on unsupervised learning of \"natural\" patterns in a dataset through the creation and adaptation of a minimum network of neurons. The results generated from the classification by ANN were compared with the most commonly used methods in the literature: the maximum likelihood method and the k-means method. From the spectral library Aster, maintained and made in part by NASA, several replications of the experiment were made, which is to classify the data according to different preestablished classes, and a measure of accuracy called kappa index was calculated for each of the replicates, in addition to the execution time of each method, so that their means were compared via confidence interval generated by nonparametric bootstrap. It was additionally investigated how principal component analysis (PCA), technique which reduces dimension of data and consequently the computational cost, can influence the performance of methods, both in its quality rating and runtime. The results show that the proposed method is superior in both aspects studied, accuracy and runtime, for the majority of applied factors. Furthermore, it is shown an example of a practical application in which a multispectral satellite image does not necessarily meet the established assumptions for using the maximum likelihood method, and there is a difference between the methods, regarding to its final classified image quality.
|