Ferramenta de automação para descoberta de conhecimento em banco de dados NOAA

O estudo de eventos climáticos é importante na tomada de decisão em políticas públicas, devido ao seu impacto social e econômico. No entanto, esse estudo lida com uma massa considerável de dados. O desenvolvimento de ferramentas eficazes para apoiar este processo é altamente recomendado,...

Full description

Bibliographic Details
Main Author: Wanderson Gomes de Almeida
Other Authors: Fernando Manuel Ramos
Language:Portuguese
Published: Instituto Nacional de Pesquisas Espaciais (INPE) 2013
Online Access:http://urlib.net/sid.inpe.br/mtc-m19/2013/04.16.19.46
Description
Summary:O estudo de eventos climáticos é importante na tomada de decisão em políticas públicas, devido ao seu impacto social e econômico. No entanto, esse estudo lida com uma massa considerável de dados. O desenvolvimento de ferramentas eficazes para apoiar este processo é altamente recomendado, pois aumentam a produtividade e confiabilidade, especialmente se eles fornecem análise e visualização de fenômenos. Este trabalho apresenta uma ferramenta que aborda as fases de Descoberta de Conhecimento em Bases de Dados, do inglês \textit{Knowledge Discovery in Databases} (KDD) de séries espaço-temporal, que são: pré-processamento, mineração de dados e pós-processamento. A ferramenta foi desenvolvida em Java empregando soluções de código majoritariamente abertos e \textit{scripts} em MATLAB. Um estudo de caso é apresentado por meio de um conjunto de dados da grande seca de 2005 na Amazônia do Centro Nacional para Pesquisa Atmosférica da Administração Nacional Oceânica e Atmosférica (NOAA). A ferramenta concebida automatiza o processo KDD que era antes realizado manualmente, portanto, contribuindo para uma maior produtividade na análise e visualização dos dados. === The study of weather events is important in decision making in public policies due to its both social and economic impacts. Nevertheless, such study deals with a considerable data mass. The development of effective tools for supporting this process is highly recommended as they increase productivity and reliability, especially if they provide phenomena analysis and visualization. This work presents a tool addressing the phases of Knowledge Discovery in Databases (KDD) for time-spatial series, which are: pre-processing, data mining and post-processing. The tool has been developed in Java employing majorly open source solutions and MATLAB. A case study is presented using a dataset of the 2005 Amazon Great Drought from the National Center for Atmospheric Research of the National Oceanic and Atmospheric Administration (NOAA). The conceived tool automates the KDD process which was before manually performed therefore contributing to higher productivity on data analysis and visualization.