Seleção de características em SVMs aplicadas a dados de expressão gênica

Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classifica...

Full description

Bibliographic Details
Main Author: Souza, Bruno Feres de
Other Authors: Carvalho, André Carlos Ponce de Leon Ferreira de
Format: Others
Language:pt
Published: Biblioteca Digitais de Teses e Dissertações da USP 2005
Subjects:
Online Access:http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/
id ndltd-usp.br-oai-teses.usp.br-tde-18112014-144007
record_format oai_dc
spelling ndltd-usp.br-oai-teses.usp.br-tde-18112014-1440072019-05-09T20:14:39Z Seleção de características em SVMs aplicadas a dados de expressão gênica Feature selection in support vector machines applied to the gene expression data Souza, Bruno Feres de Não disponível Not available Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classificação é realizada com a ajuda de algoritmos de AMáquina (AM), como as Máquinas de Vetores de Suporte, ou simplesmente SVMs. Uma particularidade dos dados de expressão gênica é que a quantidade de amostras utilizadas pelo algoritmo de aprendizado é, normalmente, muitas vezes inferior à quantidade de características consideradas, o que pode deteriorar o desempenho dos algoritmos de AM e dificultar a compreensão dos dados. Neste contexto, o presente trabalho visa à comparação de diversas técnicas de seleção de características (SC) em SVMs aplicadas a dados microarrays. Além disso, durante a pesquisa, foram desenvolvidas 2 novas técnicas de SC baseadas em algoritmos genéticos. Os experimentos demonstram que a maioria das técnicas testadas é capaz de reduzir sobremaneira a dimensionalidade dos dados de expressão gênica sem prejudicar o desempenho das SVMs. Recently, a lot of large scale gene expression analysis technologies have been introducted. Microarrays are among the most used ones. Among their most common applications, one can highlight the classificaiion of tissue samples, which is essential to the correct identification of the câncer type. This classification is carried out by Machine Learning (ML) algorithms, like the Support Vector Machines (SVMs). Gene expression data are characterized by an disproportionate rate between the number of tissue samples and the dimensionality of the domain, which can hurt the performance of the ML algorithms. In this context, the present work wish to compare several feature selection techniques in SVMs applied to microarray data. Besides, during this research, 2 new techniques based on genetic algorithms for selecting genes were developed. The experiments showed that most of the tested techniques was able to gratefully reduce the dimensionality of the gene expression data without degradation of SVM performance. Biblioteca Digitais de Teses e Dissertações da USP Carvalho, André Carlos Ponce de Leon Ferreira de 2005-05-06 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ pt Liberar o conteúdo para acesso público.
collection NDLTD
language pt
format Others
sources NDLTD
topic Não disponível
Not available
spellingShingle Não disponível
Not available
Souza, Bruno Feres de
Seleção de características em SVMs aplicadas a dados de expressão gênica
description Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classificação é realizada com a ajuda de algoritmos de AMáquina (AM), como as Máquinas de Vetores de Suporte, ou simplesmente SVMs. Uma particularidade dos dados de expressão gênica é que a quantidade de amostras utilizadas pelo algoritmo de aprendizado é, normalmente, muitas vezes inferior à quantidade de características consideradas, o que pode deteriorar o desempenho dos algoritmos de AM e dificultar a compreensão dos dados. Neste contexto, o presente trabalho visa à comparação de diversas técnicas de seleção de características (SC) em SVMs aplicadas a dados microarrays. Além disso, durante a pesquisa, foram desenvolvidas 2 novas técnicas de SC baseadas em algoritmos genéticos. Os experimentos demonstram que a maioria das técnicas testadas é capaz de reduzir sobremaneira a dimensionalidade dos dados de expressão gênica sem prejudicar o desempenho das SVMs. === Recently, a lot of large scale gene expression analysis technologies have been introducted. Microarrays are among the most used ones. Among their most common applications, one can highlight the classificaiion of tissue samples, which is essential to the correct identification of the câncer type. This classification is carried out by Machine Learning (ML) algorithms, like the Support Vector Machines (SVMs). Gene expression data are characterized by an disproportionate rate between the number of tissue samples and the dimensionality of the domain, which can hurt the performance of the ML algorithms. In this context, the present work wish to compare several feature selection techniques in SVMs applied to microarray data. Besides, during this research, 2 new techniques based on genetic algorithms for selecting genes were developed. The experiments showed that most of the tested techniques was able to gratefully reduce the dimensionality of the gene expression data without degradation of SVM performance.
author2 Carvalho, André Carlos Ponce de Leon Ferreira de
author_facet Carvalho, André Carlos Ponce de Leon Ferreira de
Souza, Bruno Feres de
author Souza, Bruno Feres de
author_sort Souza, Bruno Feres de
title Seleção de características em SVMs aplicadas a dados de expressão gênica
title_short Seleção de características em SVMs aplicadas a dados de expressão gênica
title_full Seleção de características em SVMs aplicadas a dados de expressão gênica
title_fullStr Seleção de características em SVMs aplicadas a dados de expressão gênica
title_full_unstemmed Seleção de características em SVMs aplicadas a dados de expressão gênica
title_sort seleção de características em svms aplicadas a dados de expressão gênica
publisher Biblioteca Digitais de Teses e Dissertações da USP
publishDate 2005
url http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/
work_keys_str_mv AT souzabrunoferesde selecaodecaracteristicasemsvmsaplicadasadadosdeexpressaogenica
AT souzabrunoferesde featureselectioninsupportvectormachinesappliedtothegeneexpressiondata
_version_ 1719066648184356864