Summary: | Recentemente desenvolvida, a biotecnologia denominada por Microarrays permite o monitoramento simultâneo dos valores de expressão gênica de centenas de milhares de genes, fator este que traz uma nova interpretação aos resultados obtidos em pesquisas desenvolvidas nas mais diversas áreas do conhecimento incluindo, por exemplo, a Farmacologia e Medicina, uma vez que os resultados obtidos são interpretados ao nível molecular. Contudo, apesar de muita tecnologia ser empregada à técnica de Microarrays, sua aplicação ainda ocasiona algumas complicações decorrentes, por exemplo, das inúmeras fontes de variação existentes, da escala das respostas ou da natural dificuldade de se analisar uma grande quantidade de fragmentos genéticos avaliados sob poucas unidades experimentais. Frente a estas complicações, atualmente, muitas são as propostas metodológicas de análises estatísticas para atenuar ou eliminar os problemas inerentes à técnica de Microarrays e propiciar a extração de resultados mais confiáveis a partir dos valores de expressão gênica, porém muitos desafios ainda persistem. Sob esta colocação, o presente trabalho procurou explorar duas metodologias de análise estatística alternativas no que diz respeito a seus conceitos, embora ambas tenham sido contextualizadas ao problema de Microarrays e aplicadas para se atingir o mesmo objetivo: possibilitar a identificação dos genes diferencialmente expressos sob distintas condições experimentais. A primeira metodologia consistiu da aplicação de Modelos de Análise de Variância de efeitos fixos com a adoção de modificações nas estatísticas de teste, metodologias de correções para múltiplos testes e a construção de gráficos vulcão. Já, a segunda metodologia consistiu da contextualização e aplicação da Teoria da Resposta ao Item TRI aos experimentos de Microarrays, abordagem esta pouco explorada na análise deste tipo de dado, mas a qual possibilita a seleção de genes diferencialmente expressos a partir de uma medida latente estimada para cada gene e a construção de uma escala para as categorias de resposta de expressão gênica. A motivação para este trabalho originou de um experimento de Microarrays com ratos congênicos disponibilizado pelo Laboratório de Cardiologia e Genética Molecular do Instituto do Coração (InCor-USP) cujo objetivo é identificar genes associados à hipertensão.
===
Recently developed, the biotechnology denominated Microarrays permits a simultaneous monitoring of the gene expression values of hundred thousands of genes; fact that introduces a new interpretation of the results obtained in researches developed in many distinct areas including, for example, Pharmacology and Medicine, once the obtained results are read according to the molecular level. However, despite the fact that much technology is used in the Microarrays technique, its application still causes some implications, for example, the countless sources of existing variance, the scale of answers or the natural difficulty in analyzing a large number of genetic fragments measured by few experimental units. Facing such complications, a lot of methodologies were suggested in order to reduce or eliminate the problems caused by the Microarrays technique and also foster the obtainment of more reliable results from the gene expression values, yet many challenges still persist. Under this perspective, the present work aimed at exploring two alternative methodologies regarding concepts, despite both were contextualized according to the Microarrays problem and applied with the same objective: enabling the identification of the genes differently expressed under different experimental conditions. The first methodology was composed by the application of Analysis of Variance Models of fixed effects with changes in the test statistics, correction methodologies for multiple tests and volcano plot. The second methodology consisted of the contextualization and application of the Item Response Theory IRT towards the Microarrays experiments, being this one not much explored in analysis that use this kind of data, but enabling the selection of genes differently expressed from an estimated latent trait for each gene and the construction of a scale for the categories of gene expression answers. The motivation for the present work came from an experiment of Microarrays with congenic mice made available by the Cardiology and Molecular Genetics Laboratory of the Heart Institute (InCor-USP) that aimed at identifying genes associated with hypertension.
|