Árvore de regressão para dados censurados e correlacionados

Orientador: Hildete Prisco Pinheiro === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica === Made available in DSpace on 2018-08-24T02:10:38Z (GMT). No. of bitstreams: 1 Argenton_JulianaLuzPassos_M.pdf: 2087574 bytes, checksum:...

Full description

Bibliographic Details
Main Author: Argenton, Juliana Luz Passos, 1984-
Other Authors: UNIVERSIDADE ESTADUAL DE CAMPINAS
Format: Others
Language:Portuguese
Published: [s.n.] 2013
Subjects:
Online Access:ARGENTON, Juliana Luz Passos. Árvore de regressão para dados censurados e correlacionados. 2013. 78 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/307181>. Acesso em: 23 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/307181
id ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-307181
record_format oai_dc
collection NDLTD
language Portuguese
format Others
sources NDLTD
topic Árvores de decisão
Análise de sobrevivência (Biometria)
Correlação (Estatística)
Decision tree
Survival analysis (Biometry)
Correlation (Statistics)
spellingShingle Árvores de decisão
Análise de sobrevivência (Biometria)
Correlação (Estatística)
Decision tree
Survival analysis (Biometry)
Correlation (Statistics)
Argenton, Juliana Luz Passos, 1984-
Árvore de regressão para dados censurados e correlacionados
description Orientador: Hildete Prisco Pinheiro === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica === Made available in DSpace on 2018-08-24T02:10:38Z (GMT). No. of bitstreams: 1 Argenton_JulianaLuzPassos_M.pdf: 2087574 bytes, checksum: b6014c3478501f5128fd13ddf952e6dd (MD5) Previous issue date: 2013 === Resumo: O objetivo deste trabalho é apresentar uma metodologia de árvore de regressão para dados censurados e correlacionados. O conjunto de dados analisado foi obtido a partir de uma pesquisa realizada entre Dezembro de 2005 e Janeiro de 2006, que entrevistou 119 famílias (1712 indivíduos) que vivem no pequeno vilarejo de Baependi, no Estado de Minas Gerais. São apresentadas duas metodologias com base no modelo de riscos proporcionais, a primeira desconsidera a possível correlação existente entre os indivíduos de uma mesma família e usa a primeira iteração da estimativa da verossimilhança completa nas divisões dos nós. Na segunda metodologia apresentada, a correlação entre os indivíduos de uma mesma família é incorporada no modelo de riscos proporcionais através de uma variável de fragilidade com distribuição Gama, neste caso o valor da estatística Escore é usado para escolher a melhor divisão dos nós. O objetivo da análise é avaliar as variáveis que aumentam o risco de apresentar hipertensão, diabetes tipo II e colesterol alto, que são os três principais fatores que aumentam o risco de doenças no coração. As variáveis respostas são as idades de diagnóstico desses fatores de risco. A censura é definida de acordo com a observação da idade do indivíduo no momento do diagnóstico da doença e a idade do indivíduo no momento da pesquisa. Desta forma, uma idade de diagnóstico maior que a idade no momento da pesquisa caracteriza a censura. === Abstract: The objective of this work is to present methods of regression trees for censored and correlated data. The dataset analyzed was obtained from a survey, in which 119 families (1712 individuals) living in Baependi village, in the Brazilian state of Minas Gerais, were interviewed. Two methodologies based on the proportional hazard model are presented. The first disregards the possible correlation among the individuals of the same family, using the first step of a full likelihood estimation procedure for splitting nodes. In the second methodology, the correlation among the individuals of the same family is incorporated in the proportional hazard model through a frailty variable with Gamma distribution. In this case, the value of the Score statistic is used for choosing the best splitting node. The main purpose of the analysis is to evaluate the variables that increase the risk of hypertension, type II diabetes and high cholesterol, which are the top three main factors that increase the risk of heart conditions. The response variables are the age-of-onset of these risk factors. Censoring is defined by observing the individual's age-of-onset at the moment of diagnosis and also at the moment of the survey. This way, an age-of-onset higher than the age at the moment of the survey indicates censoring. === Mestrado === Estatistica === Mestra em Estatística
author2 UNIVERSIDADE ESTADUAL DE CAMPINAS
author_facet UNIVERSIDADE ESTADUAL DE CAMPINAS
Argenton, Juliana Luz Passos, 1984-
author Argenton, Juliana Luz Passos, 1984-
author_sort Argenton, Juliana Luz Passos, 1984-
title Árvore de regressão para dados censurados e correlacionados
title_short Árvore de regressão para dados censurados e correlacionados
title_full Árvore de regressão para dados censurados e correlacionados
title_fullStr Árvore de regressão para dados censurados e correlacionados
title_full_unstemmed Árvore de regressão para dados censurados e correlacionados
title_sort árvore de regressão para dados censurados e correlacionados
publisher [s.n.]
publishDate 2013
url ARGENTON, Juliana Luz Passos. Árvore de regressão para dados censurados e correlacionados. 2013. 78 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/307181>. Acesso em: 23 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/307181
work_keys_str_mv AT argentonjulianaluzpassos1984 arvorederegressaoparadadoscensuradosecorrelacionados
AT argentonjulianaluzpassos1984 regressiontreeforcensoredandcorrelateddata
_version_ 1718883859625410560
spelling ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-3071812019-01-21T21:24:12Z Árvore de regressão para dados censurados e correlacionados Regression tree for censored and correlated data Argenton, Juliana Luz Passos, 1984- UNIVERSIDADE ESTADUAL DE CAMPINAS Pinheiro, Hildete Prisco, 1966- Lachos Dávila, Víctor Hugo Lima, Antonio Carlos Pedroso de Árvores de decisão Análise de sobrevivência (Biometria) Correlação (Estatística) Decision tree Survival analysis (Biometry) Correlation (Statistics) Orientador: Hildete Prisco Pinheiro Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica Made available in DSpace on 2018-08-24T02:10:38Z (GMT). No. of bitstreams: 1 Argenton_JulianaLuzPassos_M.pdf: 2087574 bytes, checksum: b6014c3478501f5128fd13ddf952e6dd (MD5) Previous issue date: 2013 Resumo: O objetivo deste trabalho é apresentar uma metodologia de árvore de regressão para dados censurados e correlacionados. O conjunto de dados analisado foi obtido a partir de uma pesquisa realizada entre Dezembro de 2005 e Janeiro de 2006, que entrevistou 119 famílias (1712 indivíduos) que vivem no pequeno vilarejo de Baependi, no Estado de Minas Gerais. São apresentadas duas metodologias com base no modelo de riscos proporcionais, a primeira desconsidera a possível correlação existente entre os indivíduos de uma mesma família e usa a primeira iteração da estimativa da verossimilhança completa nas divisões dos nós. Na segunda metodologia apresentada, a correlação entre os indivíduos de uma mesma família é incorporada no modelo de riscos proporcionais através de uma variável de fragilidade com distribuição Gama, neste caso o valor da estatística Escore é usado para escolher a melhor divisão dos nós. O objetivo da análise é avaliar as variáveis que aumentam o risco de apresentar hipertensão, diabetes tipo II e colesterol alto, que são os três principais fatores que aumentam o risco de doenças no coração. As variáveis respostas são as idades de diagnóstico desses fatores de risco. A censura é definida de acordo com a observação da idade do indivíduo no momento do diagnóstico da doença e a idade do indivíduo no momento da pesquisa. Desta forma, uma idade de diagnóstico maior que a idade no momento da pesquisa caracteriza a censura. Abstract: The objective of this work is to present methods of regression trees for censored and correlated data. The dataset analyzed was obtained from a survey, in which 119 families (1712 individuals) living in Baependi village, in the Brazilian state of Minas Gerais, were interviewed. Two methodologies based on the proportional hazard model are presented. The first disregards the possible correlation among the individuals of the same family, using the first step of a full likelihood estimation procedure for splitting nodes. In the second methodology, the correlation among the individuals of the same family is incorporated in the proportional hazard model through a frailty variable with Gamma distribution. In this case, the value of the Score statistic is used for choosing the best splitting node. The main purpose of the analysis is to evaluate the variables that increase the risk of hypertension, type II diabetes and high cholesterol, which are the top three main factors that increase the risk of heart conditions. The response variables are the age-of-onset of these risk factors. Censoring is defined by observing the individual's age-of-onset at the moment of diagnosis and also at the moment of the survey. This way, an age-of-onset higher than the age at the moment of the survey indicates censoring. Mestrado Estatistica Mestra em Estatística 2013 2018-08-24T02:10:38Z 2018-08-24T02:10:38Z 2013-05-12T00:00:00Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis ARGENTON, Juliana Luz Passos. Árvore de regressão para dados censurados e correlacionados. 2013. 78 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/307181>. Acesso em: 23 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/307181 por info:eu-repo/semantics/openAccess 78 f. : il. application/pdf [s.n.] Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica Programa de Pós-Graduação em Estatística reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP