Statistical modelling of data from insect studies

Data from insect studies may present different features. Univariate responses may be analyzed using generalized linear models (continuous and discrete data), survival models (time until event data), mixed effects models (longitudinal data), among other methods. These models may be used to analys...

Full description

Bibliographic Details
Main Author: Rafael de Andrade Moral
Other Authors: Clarice Garcia Borges Demetrio
Language:English
Published: Universidade de São Paulo 2017
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06042018-153400/
id ndltd-IBICT-oai-teses.usp.br-tde-06042018-153400
record_format oai_dc
collection NDLTD
language English
sources NDLTD
topic Análise de sobrevivência
Avaliação da qualidade do ajuste
Estatística ecológica
Modelos conjuntos
Modelos mistos
Software R
Ecological statistics
Goodness-of-fit assessment
Joint models
Mixed models
R software
Survival analysis
spellingShingle Análise de sobrevivência
Avaliação da qualidade do ajuste
Estatística ecológica
Modelos conjuntos
Modelos mistos
Software R
Ecological statistics
Goodness-of-fit assessment
Joint models
Mixed models
R software
Survival analysis
Rafael de Andrade Moral
Statistical modelling of data from insect studies
description Data from insect studies may present different features. Univariate responses may be analyzed using generalized linear models (continuous and discrete data), survival models (time until event data), mixed effects models (longitudinal data), among other methods. These models may be used to analyse data from experiments which assess complex ecological processes, such as competition and predation. In that sense, computational tools are useful for researchers in several fields, e.g., insect biology and physiology, applied ecology and biological control. Using different datasets from entomology as motivation, as well as other types of datasets for illustration purposes, this work intended to develop new modelling frameworks and goodness-of-fit assessment tools. We propose accelerated failure rate mixed models with simultaneous location and scale modelling with regressors to analyse time-until-attack data from a choice test experiment. We use the exponential, Weibull and exponentiated-Weibull models, and assess goodness-of-fit using half-normal plots with simulation envelopes. These plots are the subject of an entire Chapter on an R package, called hnp, developed to implement them. We use datasets from different types of experiments to illustrate the use of these plots and the package. A bivariate extension to the N-mixture modelling framework is proposed to analyse longitudinal count data for two species from the same food web that may interact directly or indirectly, and example datasets from ecological studies are used. An advantage of this modelling framework is the computation of an asymmetric correlation coefficient, which may be used by ecologists to study the degree of association between species. The jointNmix R package was also developed to implement the estimation process for these models. Finally, we propose a goodness-of-fit assessment tool for bivariate models, analogous to the half-normal plot with a simulation envelope, and illustrate the approach with simulated data and insect competition data. This tool is also implemented in an R package, called bivrp. All software developed in this thesis is made available freely on the Comprehensive R Archive Network. === Dados provenientes de estudos com insetos podem apresentar características diferentes. Respostas univariadas podem ser analisadas utilizando-se modelos lineares generalizados (dados contínuos e discretos), modelos de análise de sobrevivência (dados de tempo até ocorrência de um evento), modelos de efeitos mistos (dados longitudinais), dentre outros métodos. Esses modelos podem ser usados para analisar dados provenientes de experimentos que avaliam processos ecológicos complexos, como competição e predação. Nesse sentido, ferramentas computacionais são úteis para pesquisadores em diversos campos, por exemplo, biologia e fisiologia de insetos, ecologia aplicada e controle biológico. Utilizando diferentes conjuntos de dados entomológicos como motivação, assim como outros tipos de dados para ilustrar os métodos, este trabalho teve como objetivos desenvolver novos modelos e ferramentas para avaliar a qualidade do ajuste. Foram propostos modelos de tempo de vida acelerado mistos, com modelagem simultânea dos parâmetros de locação e de escala com regressores, para analisar dados de tempo até ataque de um experimento que avaliou escolha de predadores. Foram utilizados modelos exponencial, Weibull e Weibull-exponenciado, e a qualidade do ajuste foi avaliada utilizando gráficos meio-normais com envelope de simulação. Esses gráficos são o assunto de um Capítulo inteiro sobre um pacote para o software R, chamado hnp, desenvolvido para implementá-los. Foram utilizados conjuntos de dados de diferentes tipos de experimentos para ilustrar o uso desses gráficos e do pacote. Uma extensão bivariada para os modelos chamados \"N-mixture\" foi proposta para analisar dados longitudinais de contagem para duas espécies pertencentes à mesma teia trófica, que podem interagir direta e indiretamente, e conjuntos de dados provenientes de estudos ecológicos são usados para ilustrar a abordagem. Uma vantagem dessa estratégica de modelagem é a obtenção de um coeficiente de correlação assimétrico, que pode ser utilizado por ecologistas para inferir acerca do grau de associação entre espécies. O pacote jointNmix foi desenvolvido para implemetar o processo de estimação para esses modelos. Finalmente, foi proposta uma ferramenta de avaliação de qualidade do ajuste para modelos bivariados, análoga ao gráfico meio-normal com envelope de simulação, e a metodologia _e ilustrada com dados simulados e dados de competição de insetos. Essa ferramenta está também implementada em um pacote para o R, chamado bivrp. Todo o software desenvolvido nesta tese está disponível, gratuitamente, na Comprehensive R Archive Network (CRAN).
author2 Clarice Garcia Borges Demetrio
author_facet Clarice Garcia Borges Demetrio
Rafael de Andrade Moral
author Rafael de Andrade Moral
author_sort Rafael de Andrade Moral
title Statistical modelling of data from insect studies
title_short Statistical modelling of data from insect studies
title_full Statistical modelling of data from insect studies
title_fullStr Statistical modelling of data from insect studies
title_full_unstemmed Statistical modelling of data from insect studies
title_sort statistical modelling of data from insect studies
publisher Universidade de São Paulo
publishDate 2017
url http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06042018-153400/
work_keys_str_mv AT rafaeldeandrademoral statisticalmodellingofdatafrominsectstudies
AT rafaeldeandrademoral modelagemestatisticadedadosprovenientesdeestudosementomologia
_version_ 1718931075805216768
spelling ndltd-IBICT-oai-teses.usp.br-tde-06042018-1534002019-01-22T01:09:29Z Statistical modelling of data from insect studies Modelagem estatística de dados provenientes de estudos em entomologia Rafael de Andrade Moral Clarice Garcia Borges Demetrio Idemauro Antonio Rodrigues de Lara Rafael Pimentel Maia Afrânio Márcio Corrêa Vieira Silvio Sandoval Zocchi Análise de sobrevivência Avaliação da qualidade do ajuste Estatística ecológica Modelos conjuntos Modelos mistos Software R Ecological statistics Goodness-of-fit assessment Joint models Mixed models R software Survival analysis Data from insect studies may present different features. Univariate responses may be analyzed using generalized linear models (continuous and discrete data), survival models (time until event data), mixed effects models (longitudinal data), among other methods. These models may be used to analyse data from experiments which assess complex ecological processes, such as competition and predation. In that sense, computational tools are useful for researchers in several fields, e.g., insect biology and physiology, applied ecology and biological control. Using different datasets from entomology as motivation, as well as other types of datasets for illustration purposes, this work intended to develop new modelling frameworks and goodness-of-fit assessment tools. We propose accelerated failure rate mixed models with simultaneous location and scale modelling with regressors to analyse time-until-attack data from a choice test experiment. We use the exponential, Weibull and exponentiated-Weibull models, and assess goodness-of-fit using half-normal plots with simulation envelopes. These plots are the subject of an entire Chapter on an R package, called hnp, developed to implement them. We use datasets from different types of experiments to illustrate the use of these plots and the package. A bivariate extension to the N-mixture modelling framework is proposed to analyse longitudinal count data for two species from the same food web that may interact directly or indirectly, and example datasets from ecological studies are used. An advantage of this modelling framework is the computation of an asymmetric correlation coefficient, which may be used by ecologists to study the degree of association between species. The jointNmix R package was also developed to implement the estimation process for these models. Finally, we propose a goodness-of-fit assessment tool for bivariate models, analogous to the half-normal plot with a simulation envelope, and illustrate the approach with simulated data and insect competition data. This tool is also implemented in an R package, called bivrp. All software developed in this thesis is made available freely on the Comprehensive R Archive Network. Dados provenientes de estudos com insetos podem apresentar características diferentes. Respostas univariadas podem ser analisadas utilizando-se modelos lineares generalizados (dados contínuos e discretos), modelos de análise de sobrevivência (dados de tempo até ocorrência de um evento), modelos de efeitos mistos (dados longitudinais), dentre outros métodos. Esses modelos podem ser usados para analisar dados provenientes de experimentos que avaliam processos ecológicos complexos, como competição e predação. Nesse sentido, ferramentas computacionais são úteis para pesquisadores em diversos campos, por exemplo, biologia e fisiologia de insetos, ecologia aplicada e controle biológico. Utilizando diferentes conjuntos de dados entomológicos como motivação, assim como outros tipos de dados para ilustrar os métodos, este trabalho teve como objetivos desenvolver novos modelos e ferramentas para avaliar a qualidade do ajuste. Foram propostos modelos de tempo de vida acelerado mistos, com modelagem simultânea dos parâmetros de locação e de escala com regressores, para analisar dados de tempo até ataque de um experimento que avaliou escolha de predadores. Foram utilizados modelos exponencial, Weibull e Weibull-exponenciado, e a qualidade do ajuste foi avaliada utilizando gráficos meio-normais com envelope de simulação. Esses gráficos são o assunto de um Capítulo inteiro sobre um pacote para o software R, chamado hnp, desenvolvido para implementá-los. Foram utilizados conjuntos de dados de diferentes tipos de experimentos para ilustrar o uso desses gráficos e do pacote. Uma extensão bivariada para os modelos chamados \"N-mixture\" foi proposta para analisar dados longitudinais de contagem para duas espécies pertencentes à mesma teia trófica, que podem interagir direta e indiretamente, e conjuntos de dados provenientes de estudos ecológicos são usados para ilustrar a abordagem. Uma vantagem dessa estratégica de modelagem é a obtenção de um coeficiente de correlação assimétrico, que pode ser utilizado por ecologistas para inferir acerca do grau de associação entre espécies. O pacote jointNmix foi desenvolvido para implemetar o processo de estimação para esses modelos. Finalmente, foi proposta uma ferramenta de avaliação de qualidade do ajuste para modelos bivariados, análoga ao gráfico meio-normal com envelope de simulação, e a metodologia _e ilustrada com dados simulados e dados de competição de insetos. Essa ferramenta está também implementada em um pacote para o R, chamado bivrp. Todo o software desenvolvido nesta tese está disponível, gratuitamente, na Comprehensive R Archive Network (CRAN). 2017-12-19 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://www.teses.usp.br/teses/disponiveis/11/11134/tde-06042018-153400/ eng info:eu-repo/semantics/openAccess Universidade de São Paulo Agronomia (Estatística e Experimentação Agronômica) USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP