UM MÉTODO MULTIESTATÍSTICO PARA IDENTIFICAÇÃO DE VIAS GENÉTICAS DIFERENCIALMENTE EXPRESSAS

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === The determination of the causes and origins of a given disease is a complex undertaking, considering that there is a large number of genes engaged that interact with each other (Watson, 2006). Bioinformatics experts working in the searc...

Full description

Bibliographic Details
Main Author: Fontoura, Carla Adriane Ramos Segatto
Other Authors: Mombach, Jose Carlos Merino
Format: Others
Language:Portuguese
Published: Universidade Federal de Santa Maria 2016
Subjects:
Online Access:http://repositorio.ufsm.br/handle/1/3937
Description
Summary:Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === The determination of the causes and origins of a given disease is a complex undertaking, considering that there is a large number of genes engaged that interact with each other (Watson, 2006). Bioinformatics experts working in the search for a perfect integration between biology and information, in order to understand the likely factors that trigger certain diseases (Pevzner, 2000). To achieve this, the revolutionary methodology of Microarrays (LOCKHART et al., 1996) based on the gene expression of patients, it has been widely used to simultaneously measuring changes and regulation of the genes of the genome under certain biological conditions, resulting in a list of genes that may be considered interesting from a biological point of view for a particular disease. In this thesis, we present a multi-statistic method to detect differentially expressed genetic pathways in DNA microarray data. Many statistical methods of analysis are based on the use of a single statistical test. It is believed that the use of multiple tests decreases the number of false positive discoveries. Our method can be applied to transcriptome data to investigate which pathways have changes in expression when subjected to some type of disturbance. The method determines the activity of pathways evaluated, and verifies if the changes found are statistically significant through the bootstrap, Fisher exact and Wilcoxon tests. Implemented in R language and available for download from the Comprehensive R Archive Network (CRAN) as a package called PATHChange, our method showed consistency in its results with those predicted in the literature when tested for microarray of cancer and pre-cancer colon public data. The PATHChange method offers an alternative type of analysis of differentially expressed genes pathways for researchers seeking to determine phenotypes of diseases such as cancer. === A determinação das causas e origens de uma determinada doença é uma tarefa complexa, considerando que existe um grande número de genes comprometidos que interagem entre si (WATSON, 2006). Especialistas em Bioinformática trabalham na busca de uma perfeita integração entre a biologia e a informação, com o intuito de compreender os prováveis fatores que desencadeiam determinadas doenças (PEVZNER, 2000). Para tal, a metodologia revolucionária de Microarranjos (LOCKHART et al., 1996), baseada na expressão gênica de pacientes, tem sido amplamente utilizada para medir simultaneamente as mudanças e regulação dos genes do genoma sob certas condições biológicas, resultando em uma lista de genes que podem ser considerados interessantes do ponto de vista biológico para uma determinada doença. Na presente tese, nós apresentamos um método multiestatístico destinado à detectar vias genéticas diferencialmente expressas em dados de microarranjos de DNA. Grande parte dos métodos de análise estatística são baseados no uso de apenas um teste estatístico. Acredita-se que associar métodos estatísticos baseados em testes diferentes diminui o número de falsos positivos. O método que nós desenvolvemos determina a atividade das vias avaliadas, e verifica se as alterações encontradas são estatisticamente significativas através dos testes de bootstrap, exato de Fisher e Wilcoxon. Este método pode ser aplicado à dados de transcriptoma para investigar quais vias apresentam mudanças na expressão de seus genes quando submetidos à algum tipo de perturbação. Implementado em linguagem R e disponibilizado para download no CRAN (do inglês, Comprehensive R Archive Network) como um pacote denominado PATHChange, nosso método demonstrou consistência entre os seus resultados com os previstos na literatura quando testado para dados públicos de microarranjos de câncer e pré-câncer de cólon. O método do PATHChange oferece um tipo alternativo de análise de vias de genes diferencialmente expressas para os pesquisadores que buscam apurar fenótipos de doenças, tais como o câncer.