Summary: | Um dos principais setores da economia brasileira, o agronegócio envolve uma série de negociações dentro de toda a cadeia produtiva. Instituições de pesquisa como o CEPEA (Centro de Estudos Avançados em Economia Aplicada), da ESALQ/USP, coletam diariamente dados sobre diversos produtos agropecuários, gerando informações para agentes de diferentes categorias interessados no acompanhamento desses mercados, entre eles pesquisadores, produtores e formuladores de políticas públicas. O uso desses dados para realização de análises históricas integradas com análises atuais de mercado, porém, ainda é um desafio, dada a falta de uma padronização e a necessidade de identificação de técnicas computacionais adequadas. O objetivo desta tese é organizar as informações agroeconômicas consolidadas por meio de modelos de Data Mining e estatísticos para gerar análises integradas de relações entre as séries temporais, compreendendo produtos, mercados e o tempo, baseando-se nos dados obtidos pelo CEPEA em 7 anos de coleta diária de preços. As técnicas propostas para o modelo de análise integrada compreendem séries temporais para a projeção de trajetórias temporais e reconhecimento de padrões temporais. Especificamente para as trajetórias temporais, as técnicas utilizadas são de Matrizes de Correlações e Decomposição de Tucker e trajetórias, as quais permitem uma redução das matrizes e identificação de pontos relevantes no conjunto de dados. Já o reconhecimento de padrões nas séries temporais de grande volume de dados é obtido por meio de duas fases. Inicialmente, os dados são preparados utilizando-se as técnicas de redução de dimensionalidade e discretização. Posteriormente, é realizada a busca por motifs, que se utiliza de métricas de distâncias para encontrar similaridades entre as séries temporais ou entre sub partes de uma mesma série temporal para estas, destaca-se a aplicação do MINDIST e das distâncias euclidianas. Os resultados obtidos do modelo integrado são reportados em dois estudos de casos, sendo o primeiro sobre trajetórias temporais e o segundo, sobre identificação de padrões temporais. O conjunto de dados utilizado para ambos os casos foram preços comercialização de grãos no mercado interno do Brasil e valores negociados em Bolsa de valores de Chicago-EUA. === One of the main activities economy sector in Brazil is agribusiness and involves several negotiations within the entire supply chain. Researchers Centers, as example CEPEA (Center for Advanced Studies on Applied Economics) from ESALQ / USP, collect daily data of agricultural products, generating information for players and staff of several categories for these markets, including researchers, producers and governmental. These historical data of agricultural market is used to create integrated analyses. However, it is still a challenge deal with the data standard or which statistical techniques is appropriated in order to perform a data analysis. The aim of the thesis is to provide an Agrieconomics analyses by data mining and statistical models, analyzing the relationship between time series, products, markets and time, based on dataset from CEPEA over seven years of daily prices. In order to understand the behaviors and patterns of these time series, two case studies were produced. The first case study was temporal trajectories, the techniques used were Correlations Matrix, Tucker Decomposition and trajectories, which allow a reduction of the matrices and identification of relevant points in the data set. The second case study applied was the patterns identification, where the main idea was understand and highlight events that happens frequently over seven year of daily grain prices quotation in several products. In order to proceed the technique, the data are prepared using the dimensionality and discretization reduction. Next, the search for motifs is performed using metrics distance to find similarities in time series or between parts of the same time series, in special two time series was used, that are MINDIST and Euclidean distances. The results give a understanding of the dynamic of these grains time series, such as, Some important aspects were detect by applying the trajectories, first that the both products soybean and corn prices has opposites trajectories, it is possible to infer this products competes in fields for next crops. On the market analysis, the trajectory of Chicago Stock Market spread the behavior of the prices in Brazil domestic market, both trajectories are similar over the years.
|