Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar
Orientador: Luiz Henrique Antunes Rodrigues === Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola === Made available in DSpace on 2018-08-28T09:48:01Z (GMT). No. of bitstreams: 1 Peloia_PauloRodrigues_D.pdf: 1851900 bytes, checksum: 758d89c257994cf08ae7c6641daf86...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Published: |
[s.n.]
2015
|
Subjects: | |
Online Access: | PELOIA, Paulo Rodrigues. Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar. 2015. 102 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/256754>. Acesso em: 28 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/256754 |
id |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-256754 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
format |
Others
|
sources |
NDLTD |
topic |
Mineração de dados (Computação) - Métodos estatísticos Variabilidade Produtividade Data Mining (Computing) Variability Produtivity |
spellingShingle |
Mineração de dados (Computação) - Métodos estatísticos Variabilidade Produtividade Data Mining (Computing) Variability Produtivity Peloia, Paulo Rodrigues, 1982- Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
description |
Orientador: Luiz Henrique Antunes Rodrigues === Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola === Made available in DSpace on 2018-08-28T09:48:01Z (GMT). No. of bitstreams: 1
Peloia_PauloRodrigues_D.pdf: 1851900 bytes, checksum: 758d89c257994cf08ae7c6641daf8619 (MD5)
Previous issue date: 2015 === Resumo: As indústrias do setor sucroalcooleiro coletam anualmente, durante sua operação comercial normal, milhares de dados relacionadas à produção e fatores que podem influenciá-la. A análise descritiva de padrões nos fatores de influência associados à talhões de destacado desempenho relacionado ao potencial produtivo pode ser um ponto chave para tornar o sistema de produção mais eficiente, principalmente quando passíveis de ação e/ou inesperados, assim auxiliando na tomada de decisão ou servindo de hipótese para experimentos específicos futuros em condições controladas. Apesar desta disponibilidade de bases de dados e potenciais resultados, ainda existe uma lacuna em abordagens que contemplem desde a obtenção e preparação dos dados até extração de padrões num formato compreensível. Assim, o objetivo desta pesquisa foi propor uma abordagem baseada na técnica de indução de regras de decisão para análise descritiva de padrões em talhões de alto e baixo desempenho em produtividade na cana-de-açúcar. A abordagem possui 9 etapas, sendo: obtenção da base de dados de produtividade e seu enriquecimento com dados de fatores de influência complementares e sua limpeza; criação de atributos derivados, padronização do potencial produtivo dos talhões e segmentação em baixo e alto desempenho pelo método K-means; extração de regras por indução de regras de decisão usando os algoritmos RIPPER e Classification Tree, seguida pela seleção das principais regras por medidas de interesse (Novidade e Likelihood ratio ou precisão e complexidade); avaliação agronômica das regras selecionadas e dos atributos descritores. A abordagem foi exemplificada numa base de dados de produtividade de talhões de duas safras consecutivas de uma unidade de produção de cana-de-açúcar. Os resultados mostraram que a abordagem foi capaz de descrever 18 padrões, sendo 10 passíveis de ação e 4 inesperados. A abordagem proposta mostrou-se válida para descrever padrões inesperados ou passíveis de ação relacionados à produtividade, reproduzindo o conhecimento de especialistas de forma estruturada (passível de reprodução) e automática (sem a necessidade um especialista durante o processo), podendo ser estendida a outras culturas === Abstract: Industries of sugarcane sector collect annually thousands of information related to production and influence factors during current commercial operation. The descriptive analysis of influence factors patterns related to commercial blocks with outstanding performance related to productive potential may be a key-point to make the sugarcane production system more efficient, mainly when actionable and/or unexpected, thus assisting decision making or being hypothesis for future specific experiments under controlled conditions. Despite of the databases availability and potential results, still exist a gap in approaches that cover from the data obtainment and preparation until patterns extraction in a comprehensive format. Therefore, the objective of this research is to propose a methodology based on decision rules induction technique to descriptively analyze patterns in commercial blocks with high and low performance regarding sugarcane yield. The approach has 9 phases: yield database obtainment and its enrichment with complementary influence factors data and clean up; derived attributes creation, productive potential of commercial blocks standardization and clustering in high and low performance by k-means method; rules induction by algorithms RIPPER and Classification Tree, followed by main rules selection based on interestingness measures (Novelty and Likelihood ratio or precision and complexity); agronomic evaluation of selected rules and descriptive attributes. The approach has been exemplified in a two consecutive season yield database of commercial blocks from a production unit has been analyzed. Results show that the approach was able to describe 18 patterns, where 10 are actionable and 4 unexpected. The proposed approach is valid to describe unexpected patterns or actionable ones related to yield, reproducing the experts knowledge in a structured form (reproducible) and automatically (nor requiring an knowledge expert during the process). It may be extended to other crops === Doutorado === Planejamento e Desenvolvimento Rural Sustentável === Doutor em Engenharia Agrícola === 2012/50049-3 === FAPESP |
author2 |
UNIVERSIDADE ESTADUAL DE CAMPINAS |
author_facet |
UNIVERSIDADE ESTADUAL DE CAMPINAS Peloia, Paulo Rodrigues, 1982- |
author |
Peloia, Paulo Rodrigues, 1982- |
author_sort |
Peloia, Paulo Rodrigues, 1982- |
title |
Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
title_short |
Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
title_full |
Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
title_fullStr |
Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
title_full_unstemmed |
Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
title_sort |
indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar |
publisher |
[s.n.] |
publishDate |
2015 |
url |
PELOIA, Paulo Rodrigues. Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar. 2015. 102 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/256754>. Acesso em: 28 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/256754 |
work_keys_str_mv |
AT peloiapaulorodrigues1982 inducaoderegrasdedecisaoparaanalisedescritivadepadroesdeprodutividadeemtalhoesdecanadeacucar AT peloiapaulorodrigues1982 decisionrulesinductionfordescriptiveanalysisofyieldpatternsincommercialblocksofsugarcane |
_version_ |
1718885151017009152 |
spelling |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-2567542019-01-21T21:31:39Z Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar Decision rules induction for descriptive analysis of yield patterns in commercial blocks of sugar cane Peloia, Paulo Rodrigues, 1982- UNIVERSIDADE ESTADUAL DE CAMPINAS Rodrigues, Luiz Henrique Antunes, 1959- Canteri, Marcelo Giovanetti Beauclair, Edgar Gomes Ferreira de Romanelli, Thiago Libório Meira, Carlos Alberto Alves Mineração de dados (Computação) - Métodos estatísticos Variabilidade Produtividade Data Mining (Computing) Variability Produtivity Orientador: Luiz Henrique Antunes Rodrigues Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola Made available in DSpace on 2018-08-28T09:48:01Z (GMT). No. of bitstreams: 1 Peloia_PauloRodrigues_D.pdf: 1851900 bytes, checksum: 758d89c257994cf08ae7c6641daf8619 (MD5) Previous issue date: 2015 Resumo: As indústrias do setor sucroalcooleiro coletam anualmente, durante sua operação comercial normal, milhares de dados relacionadas à produção e fatores que podem influenciá-la. A análise descritiva de padrões nos fatores de influência associados à talhões de destacado desempenho relacionado ao potencial produtivo pode ser um ponto chave para tornar o sistema de produção mais eficiente, principalmente quando passíveis de ação e/ou inesperados, assim auxiliando na tomada de decisão ou servindo de hipótese para experimentos específicos futuros em condições controladas. Apesar desta disponibilidade de bases de dados e potenciais resultados, ainda existe uma lacuna em abordagens que contemplem desde a obtenção e preparação dos dados até extração de padrões num formato compreensível. Assim, o objetivo desta pesquisa foi propor uma abordagem baseada na técnica de indução de regras de decisão para análise descritiva de padrões em talhões de alto e baixo desempenho em produtividade na cana-de-açúcar. A abordagem possui 9 etapas, sendo: obtenção da base de dados de produtividade e seu enriquecimento com dados de fatores de influência complementares e sua limpeza; criação de atributos derivados, padronização do potencial produtivo dos talhões e segmentação em baixo e alto desempenho pelo método K-means; extração de regras por indução de regras de decisão usando os algoritmos RIPPER e Classification Tree, seguida pela seleção das principais regras por medidas de interesse (Novidade e Likelihood ratio ou precisão e complexidade); avaliação agronômica das regras selecionadas e dos atributos descritores. A abordagem foi exemplificada numa base de dados de produtividade de talhões de duas safras consecutivas de uma unidade de produção de cana-de-açúcar. Os resultados mostraram que a abordagem foi capaz de descrever 18 padrões, sendo 10 passíveis de ação e 4 inesperados. A abordagem proposta mostrou-se válida para descrever padrões inesperados ou passíveis de ação relacionados à produtividade, reproduzindo o conhecimento de especialistas de forma estruturada (passível de reprodução) e automática (sem a necessidade um especialista durante o processo), podendo ser estendida a outras culturas Abstract: Industries of sugarcane sector collect annually thousands of information related to production and influence factors during current commercial operation. The descriptive analysis of influence factors patterns related to commercial blocks with outstanding performance related to productive potential may be a key-point to make the sugarcane production system more efficient, mainly when actionable and/or unexpected, thus assisting decision making or being hypothesis for future specific experiments under controlled conditions. Despite of the databases availability and potential results, still exist a gap in approaches that cover from the data obtainment and preparation until patterns extraction in a comprehensive format. Therefore, the objective of this research is to propose a methodology based on decision rules induction technique to descriptively analyze patterns in commercial blocks with high and low performance regarding sugarcane yield. The approach has 9 phases: yield database obtainment and its enrichment with complementary influence factors data and clean up; derived attributes creation, productive potential of commercial blocks standardization and clustering in high and low performance by k-means method; rules induction by algorithms RIPPER and Classification Tree, followed by main rules selection based on interestingness measures (Novelty and Likelihood ratio or precision and complexity); agronomic evaluation of selected rules and descriptive attributes. The approach has been exemplified in a two consecutive season yield database of commercial blocks from a production unit has been analyzed. Results show that the approach was able to describe 18 patterns, where 10 are actionable and 4 unexpected. The proposed approach is valid to describe unexpected patterns or actionable ones related to yield, reproducing the experts knowledge in a structured form (reproducible) and automatically (nor requiring an knowledge expert during the process). It may be extended to other crops Doutorado Planejamento e Desenvolvimento Rural Sustentável Doutor em Engenharia Agrícola 2012/50049-3 FAPESP 2015 2018-08-28T09:48:01Z 2018-08-28T09:48:01Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis PELOIA, Paulo Rodrigues. Indução de regras de decisão para análise descritiva de padrões de produtividade em talhões de cana-de-açúcar. 2015. 102 p. Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Agrícola, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/256754>. Acesso em: 28 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/256754 info:eu-repo/semantics/openAccess 102 p. : il. application/pdf [s.n.] Universidade Estadual de Campinas. Faculdade de Engenharia Agrícola Programa de Pós-Graduação em Engenharia Agrícola reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP |