Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar

Orientador: Luiz Henrique Antunes Rodrigues === Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola === Made available in DSpace on 2018-08-28T09:48:01Z (GMT). No. of bitstreams: 1 Peloia_PauloRodrigues_D.pdf: 1851900 bytes, checksum: 758d89c257994cf08ae7c6641daf86...

Full description

Bibliographic Details
Main Author: Peloia, Paulo Rodrigues, 1982-
Other Authors: UNIVERSIDADE ESTADUAL DE CAMPINAS
Format: Others
Published: [s.n.] 2015
Subjects:
Online Access:PELOIA, Paulo Rodrigues. Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar. 2015. 102 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/256754>. Acesso em: 28 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/256754
Description
Summary:Orientador: Luiz Henrique Antunes Rodrigues === Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola === Made available in DSpace on 2018-08-28T09:48:01Z (GMT). No. of bitstreams: 1 Peloia_PauloRodrigues_D.pdf: 1851900 bytes, checksum: 758d89c257994cf08ae7c6641daf8619 (MD5) Previous issue date: 2015 === Resumo: As indústrias do setor sucroalcooleiro coletam anualmente, durante sua operação comercial normal, milhares de dados relacionadas à produção e fatores que podem influenciá-la. A análise descritiva de padrões nos fatores de influência associados à talhões de destacado desempenho relacionado ao potencial produtivo pode ser um ponto chave para tornar o sistema de produção mais eficiente, principalmente quando passíveis de ação e/ou inesperados, assim auxiliando na tomada de decisão ou servindo de hipótese para experimentos específicos futuros em condições controladas. Apesar desta disponibilidade de bases de dados e potenciais resultados, ainda existe uma lacuna em abordagens que contemplem desde a obtenção e preparação dos dados até extração de padrões num formato compreensível. Assim, o objetivo desta pesquisa foi propor uma abordagem baseada na técnica de indução de regras de decisão para análise descritiva de padrões em talhões de alto e baixo desempenho em produtividade na cana-de-açúcar. A abordagem possui 9 etapas, sendo: obtenção da base de dados de produtividade e seu enriquecimento com dados de fatores de influência complementares e sua limpeza; criação de atributos derivados, padronização do potencial produtivo dos talhões e segmentação em baixo e alto desempenho pelo método K-means; extração de regras por indução de regras de decisão usando os algoritmos RIPPER e Classification Tree, seguida pela seleção das principais regras por medidas de interesse (Novidade e Likelihood ratio ou precisão e complexidade); avaliação agronômica das regras selecionadas e dos atributos descritores. A abordagem foi exemplificada numa base de dados de produtividade de talhões de duas safras consecutivas de uma unidade de produção de cana-de-açúcar. Os resultados mostraram que a abordagem foi capaz de descrever 18 padrões, sendo 10 passíveis de ação e 4 inesperados. A abordagem proposta mostrou-se válida para descrever padrões inesperados ou passíveis de ação relacionados à produtividade, reproduzindo o conhecimento de especialistas de forma estruturada (passível de reprodução) e automática (sem a necessidade um especialista durante o processo), podendo ser estendida a outras culturas === Abstract: Industries of sugarcane sector collect annually thousands of information related to production and influence factors during current commercial operation. The descriptive analysis of influence factors patterns related to commercial blocks with outstanding performance related to productive potential may be a key-point to make the sugarcane production system more efficient, mainly when actionable and/or unexpected, thus assisting decision making or being hypothesis for future specific experiments under controlled conditions. Despite of the databases availability and potential results, still exist a gap in approaches that cover from the data obtainment and preparation until patterns extraction in a comprehensive format. Therefore, the objective of this research is to propose a methodology based on decision rules induction technique to descriptively analyze patterns in commercial blocks with high and low performance regarding sugarcane yield. The approach has 9 phases: yield database obtainment and its enrichment with complementary influence factors data and clean up; derived attributes creation, productive potential of commercial blocks standardization and clustering in high and low performance by k-means method; rules induction by algorithms RIPPER and Classification Tree, followed by main rules selection based on interestingness measures (Novelty and Likelihood ratio or precision and complexity); agronomic evaluation of selected rules and descriptive attributes. The approach has been exemplified in a two consecutive season yield database of commercial blocks from a production unit has been analyzed. Results show that the approach was able to describe 18 patterns, where 10 are actionable and 4 unexpected. The proposed approach is valid to describe unexpected patterns or actionable ones related to yield, reproducing the experts knowledge in a structured form (reproducible) and automatically (nor requiring an knowledge expert during the process). It may be extended to other crops === Doutorado === Planejamento e Desenvolvimento Rural Sustentável === Doutor em Engenharia Agrícola === 2012/50049-3 === FAPESP