Análise de expressões gênicas com erros de medida e aplicação em dados reais

Toda medida, desde que feita por um instrumento real, tem uma imprecisão associada. Neste trabalho, abordamos a questão das imprecisões em experimentos de microarranjos de cDNA de dois canais, uma tecnologia que tem sido muito explorada nos últimos anos e que ainda é um importante auxiliar nos estud...

Full description

Bibliographic Details
Main Author: Ribeiro, Adèle Helena
Other Authors: Hirata Junior, Roberto
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2014
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/45/45134/tde-04082014-163616/
id ndltd-usp.br-oai-teses.usp.br-tde-04082014-163616
record_format oai_dc
collection NDLTD
language pt
format Others
sources NDLTD
topic DNA microarrays
expressão gênica
gene expression
imprecisões
microarranjos
uncertainty
spellingShingle DNA microarrays
expressão gênica
gene expression
imprecisões
microarranjos
uncertainty
Ribeiro, Adèle Helena
Análise de expressões gênicas com erros de medida e aplicação em dados reais
description Toda medida, desde que feita por um instrumento real, tem uma imprecisão associada. Neste trabalho, abordamos a questão das imprecisões em experimentos de microarranjos de cDNA de dois canais, uma tecnologia que tem sido muito explorada nos últimos anos e que ainda é um importante auxiliar nos estudos de expressões gênicas. Dezenas de milhares de representantes de genes são impressos em uma lâmina de vidro e hibridizados simultaneamente com RNA mensageiro de duas amostras diferentes de células. Essas amostras são marcadas com corantes fluorescentes diferentes e a lâmina, após a hibridização, é digitalizada, obtendo-se duas imagens. As imagens são analisadas com programas especiais que segmentam os locais que estavam os genes e extraem estatísticas dos píxeis de cada local. Por exemplo, a média, a mediana e a variância das intensidades do conjunto de píxeis de cada local (o mesmo é feito normalmente para uma área em volta de cada local, chamada de fundo). Estimadores estatísticos como o da variância nos dão uma estimativa de quão precisa é uma certa medida. Uma vez de posse das estimativas das intensidades de cada local, para se obter a efetiva expressão de um gene, algumas transformações são feitas nos dados de forma a eliminar variabilidades sistemáticas. Neste trabalho, mostramos como podem ser feitas as análises a partir de uma medida de expressão gênica com um erro estimado. Mostramos como estimar essa imprecisão e estudamos, em termos de propagação da imprecisão, os efeitos de algumas transformações realizadas nos dados, por exemplo, a remoção do viés estimado pelo método de regressão local robusta, mais conhecido como \\textit{lowess}. Uma vez obtidas as estimativas das imprecisões propagadas, mostramos também como utilizá-las na determinação dos genes diferencialmente expressos entre as amostras estudadas. Por fim, comparamos os resultados com os obtidos por formas clássicas de análise, em que são desconsideradas as imprecisões das medidas. Concluímos que a modelagem das imprecisões das medidas pode favorecer as análises, já que os resultados obtidos em uma aplicação com dados reais de expressões gênicas foram condizentes com os que encontramos na literatura. === Any measurement, since it is made for a real instrument, has an uncertainty associated with it. In the present paper, we address this issue of uncertainty in two-channel cDNA Microarray experiments, a technology that has been widely used in recent years and is still an important tool for gene expression studies. Tens of thousands of gene representatives are printed onto a glass slide and hybridized simultaneously with mRNA from two different cell samples. Different fluorescent dyes are used for labeling both samples. After hybridization, the glass slide is scanned yielding two images. Image processing and analysis programs are used for spot segmentation and pixel statistics computation, for instance, the mean, median and variance of pixel intensities for each spot. The same statistics are computed for the pixel intensities in the background region. Statistical estimators such as the variance gives us an estimate of the accuracy of a measurement. Based on the intensity estimates for each spot, some data transformations are applied in order to eliminate systematic variability so we can obtain the effective gene expression. This paper shows how to analyze gene expression measurements with an estimated error. We presented an estimate of this uncertainty and we studied, in terms of error propagation, the effects of some data transformations. An example of data transformation is the correction of the bias estimated by a robust local regression method, also known as \\textit{lowess}. With the propagated errors obtained, we also showed how to use them for detecting differentially expressed genes between different conditions. Finally, we compared the results with those obtained by classical analysis methods, in which the measurement errors are disregarded. We conclude that modeling the measurements uncertainties can improve the analysis, since the results obtained in a real gene expressions data base were consistent with the literature.
author2 Hirata Junior, Roberto
author_facet Hirata Junior, Roberto
Ribeiro, Adèle Helena
author Ribeiro, Adèle Helena
author_sort Ribeiro, Adèle Helena
title Análise de expressões gênicas com erros de medida e aplicação em dados reais
title_short Análise de expressões gênicas com erros de medida e aplicação em dados reais
title_full Análise de expressões gênicas com erros de medida e aplicação em dados reais
title_fullStr Análise de expressões gênicas com erros de medida e aplicação em dados reais
title_full_unstemmed Análise de expressões gênicas com erros de medida e aplicação em dados reais
title_sort análise de expressões gênicas com erros de medida e aplicação em dados reais
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2014
url http://www.teses.usp.br/teses/disponiveis/45/45134/tde-04082014-163616/
work_keys_str_mv AT ribeiroadelehelena analisedeexpressoesgenicascomerrosdemedidaeaplicacaoemdadosreais
AT ribeiroadelehelena geneexpressionanalysistakingintoaccountmeasurementerrorsandapplicationtorealdata
_version_ 1719051718668320768
spelling ndltd-usp.br-oai-teses.usp.br-tde-04082014-1636162019-05-09T17:57:25Z Análise de expressões gênicas com erros de medida e aplicação em dados reais Gene expression analysis taking into account measurement errors and application to real data Ribeiro, Adèle Helena DNA microarrays expressão gênica gene expression imprecisões microarranjos uncertainty Toda medida, desde que feita por um instrumento real, tem uma imprecisão associada. Neste trabalho, abordamos a questão das imprecisões em experimentos de microarranjos de cDNA de dois canais, uma tecnologia que tem sido muito explorada nos últimos anos e que ainda é um importante auxiliar nos estudos de expressões gênicas. Dezenas de milhares de representantes de genes são impressos em uma lâmina de vidro e hibridizados simultaneamente com RNA mensageiro de duas amostras diferentes de células. Essas amostras são marcadas com corantes fluorescentes diferentes e a lâmina, após a hibridização, é digitalizada, obtendo-se duas imagens. As imagens são analisadas com programas especiais que segmentam os locais que estavam os genes e extraem estatísticas dos píxeis de cada local. Por exemplo, a média, a mediana e a variância das intensidades do conjunto de píxeis de cada local (o mesmo é feito normalmente para uma área em volta de cada local, chamada de fundo). Estimadores estatísticos como o da variância nos dão uma estimativa de quão precisa é uma certa medida. Uma vez de posse das estimativas das intensidades de cada local, para se obter a efetiva expressão de um gene, algumas transformações são feitas nos dados de forma a eliminar variabilidades sistemáticas. Neste trabalho, mostramos como podem ser feitas as análises a partir de uma medida de expressão gênica com um erro estimado. Mostramos como estimar essa imprecisão e estudamos, em termos de propagação da imprecisão, os efeitos de algumas transformações realizadas nos dados, por exemplo, a remoção do viés estimado pelo método de regressão local robusta, mais conhecido como \\textit{lowess}. Uma vez obtidas as estimativas das imprecisões propagadas, mostramos também como utilizá-las na determinação dos genes diferencialmente expressos entre as amostras estudadas. Por fim, comparamos os resultados com os obtidos por formas clássicas de análise, em que são desconsideradas as imprecisões das medidas. Concluímos que a modelagem das imprecisões das medidas pode favorecer as análises, já que os resultados obtidos em uma aplicação com dados reais de expressões gênicas foram condizentes com os que encontramos na literatura. Any measurement, since it is made for a real instrument, has an uncertainty associated with it. In the present paper, we address this issue of uncertainty in two-channel cDNA Microarray experiments, a technology that has been widely used in recent years and is still an important tool for gene expression studies. Tens of thousands of gene representatives are printed onto a glass slide and hybridized simultaneously with mRNA from two different cell samples. Different fluorescent dyes are used for labeling both samples. After hybridization, the glass slide is scanned yielding two images. Image processing and analysis programs are used for spot segmentation and pixel statistics computation, for instance, the mean, median and variance of pixel intensities for each spot. The same statistics are computed for the pixel intensities in the background region. Statistical estimators such as the variance gives us an estimate of the accuracy of a measurement. Based on the intensity estimates for each spot, some data transformations are applied in order to eliminate systematic variability so we can obtain the effective gene expression. This paper shows how to analyze gene expression measurements with an estimated error. We presented an estimate of this uncertainty and we studied, in terms of error propagation, the effects of some data transformations. An example of data transformation is the correction of the bias estimated by a robust local regression method, also known as \\textit{lowess}. With the propagated errors obtained, we also showed how to use them for detecting differentially expressed genes between different conditions. Finally, we compared the results with those obtained by classical analysis methods, in which the measurement errors are disregarded. We conclude that modeling the measurements uncertainties can improve the analysis, since the results obtained in a real gene expressions data base were consistent with the literature. Biblioteca Digitais de Teses e Dissertações da USP Hirata Junior, Roberto 2014-06-03 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/45/45134/tde-04082014-163616/ pt Liberar o conteúdo para acesso público.