Summary: | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === The determination of the causes and origins of a given disease is a complex undertaking, considering
that there is a large number of genes engaged that interact with each other (Watson,
2006). Bioinformatics experts working in the search for a perfect integration between biology
and information, in order to understand the likely factors that trigger certain diseases (Pevzner,
2000). To achieve this, the revolutionary methodology of Microarrays (LOCKHART et
al., 1996) based on the gene expression of patients, it has been widely used to simultaneously
measuring changes and regulation of the genes of the genome under certain biological conditions,
resulting in a list of genes that may be considered interesting from a biological point of
view for a particular disease. In this thesis, we present a multi-statistic method to detect differentially
expressed genetic pathways in DNA microarray data. Many statistical methods of
analysis are based on the use of a single statistical test. It is believed that the use of multiple
tests decreases the number of false positive discoveries. Our method can be applied to transcriptome
data to investigate which pathways have changes in expression when subjected to some
type of disturbance. The method determines the activity of pathways evaluated, and verifies
if the changes found are statistically significant through the bootstrap, Fisher exact and Wilcoxon
tests. Implemented in R language and available for download from the Comprehensive R
Archive Network (CRAN) as a package called PATHChange, our method showed consistency
in its results with those predicted in the literature when tested for microarray of cancer and
pre-cancer colon public data. The PATHChange method offers an alternative type of analysis
of differentially expressed genes pathways for researchers seeking to determine phenotypes of
diseases such as cancer. === A determinação das causas e origens de uma determinada doença é uma tarefa complexa, considerando
que existe um grande número de genes comprometidos que interagem entre si (WATSON,
2006). Especialistas em Bioinformática trabalham na busca de uma perfeita integração
entre a biologia e a informação, com o intuito de compreender os prováveis fatores que desencadeiam
determinadas doenças (PEVZNER, 2000). Para tal, a metodologia revolucionária
de Microarranjos (LOCKHART et al., 1996), baseada na expressão gênica de pacientes, tem
sido amplamente utilizada para medir simultaneamente as mudanças e regulação dos genes do
genoma sob certas condições biológicas, resultando em uma lista de genes que podem ser considerados
interessantes do ponto de vista biológico para uma determinada doença. Na presente
tese, nós apresentamos um método multiestatístico destinado à detectar vias genéticas diferencialmente
expressas em dados de microarranjos de DNA. Grande parte dos métodos de análise
estatística são baseados no uso de apenas um teste estatístico. Acredita-se que associar métodos
estatísticos baseados em testes diferentes diminui o número de falsos positivos. O método
que nós desenvolvemos determina a atividade das vias avaliadas, e verifica se as alterações encontradas
são estatisticamente significativas através dos testes de bootstrap, exato de Fisher e
Wilcoxon. Este método pode ser aplicado à dados de transcriptoma para investigar quais vias
apresentam mudanças na expressão de seus genes quando submetidos à algum tipo de perturbação.
Implementado em linguagem R e disponibilizado para download no CRAN (do inglês,
Comprehensive R Archive Network) como um pacote denominado PATHChange, nosso método
demonstrou consistência entre os seus resultados com os previstos na literatura quando testado
para dados públicos de microarranjos de câncer e pré-câncer de cólon. O método do PATHChange
oferece um tipo alternativo de análise de vias de genes diferencialmente expressas para
os pesquisadores que buscam apurar fenótipos de doenças, tais como o câncer.
|