Summary: | Dissertação de Mestrado em Estatística apresentada à Faculdade de Ciências da Universidade do Porto === A aplicação de um regime específico de quimioterapia, depende de um correcto diagnóstico do paciente. Actualmente, esse diagnóstico não é efectuado de uma forma sistemática e geral, necessitando da intervenção de diferentes especialistas. Com a monitorização da expressão de milhares de genes em simultâneo, a recente tecnologia dos microarrays de ADN representa um grande passo para a sistematização do diagnóstico oncológico. No entanto, esta tecnologia produz informação em que o número de variáveis (genes) excede largamente o número de observações (amostras), o que dificulta a utilização das ferramentas estatísticas habituais de classificação. Neste sentido, torna-se necessário implementar estratégias de redução da dimensão do espaço predictor. Contudo, esta redução, que equivale a seleccionar um subconjunto de genes do conjunto inicial, deve ser extremamente direccionada, pois sabe-se que apesar do seu elevado número, apenas uma pequena parte dos genes monitorizados determina o tipo de tecido. Identificar genes com potencial predictivo é um objectivo central dos estudos de microarray aplicados à classificação de tumores. A criação de mecanismos que permitam reter apenas estes genes é essencial, tanto a nível estatístico (pois só com redução de dimensão poderemos aplicar as metodologias habituais) como a nível de interpretação biológica.O presente estudo pretende efectuar uma introdução a este novo tipo de tecnologia e de dados, procurando mostrar algumas das metodologias utilizadas para a sua análise. Em particular, centramo-nos no estudo de diferentes estratégias de escolha de genes predictivos e na sua utilização para a classificação de tumores cancerígenos.
|