Seleção de características em SVMs aplicadas a dados de expressão gênica
Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classifica...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Language: | pt |
Published: |
Biblioteca Digitais de Teses e Dissertações da USP
2005
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ |
id |
ndltd-usp.br-oai-teses.usp.br-tde-18112014-144007 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-usp.br-oai-teses.usp.br-tde-18112014-1440072019-05-09T20:14:39Z Seleção de características em SVMs aplicadas a dados de expressão gênica Feature selection in support vector machines applied to the gene expression data Souza, Bruno Feres de Não disponível Not available Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classificação é realizada com a ajuda de algoritmos de AMáquina (AM), como as Máquinas de Vetores de Suporte, ou simplesmente SVMs. Uma particularidade dos dados de expressão gênica é que a quantidade de amostras utilizadas pelo algoritmo de aprendizado é, normalmente, muitas vezes inferior à quantidade de características consideradas, o que pode deteriorar o desempenho dos algoritmos de AM e dificultar a compreensão dos dados. Neste contexto, o presente trabalho visa à comparação de diversas técnicas de seleção de características (SC) em SVMs aplicadas a dados microarrays. Além disso, durante a pesquisa, foram desenvolvidas 2 novas técnicas de SC baseadas em algoritmos genéticos. Os experimentos demonstram que a maioria das técnicas testadas é capaz de reduzir sobremaneira a dimensionalidade dos dados de expressão gênica sem prejudicar o desempenho das SVMs. Recently, a lot of large scale gene expression analysis technologies have been introducted. Microarrays are among the most used ones. Among their most common applications, one can highlight the classificaiion of tissue samples, which is essential to the correct identification of the câncer type. This classification is carried out by Machine Learning (ML) algorithms, like the Support Vector Machines (SVMs). Gene expression data are characterized by an disproportionate rate between the number of tissue samples and the dimensionality of the domain, which can hurt the performance of the ML algorithms. In this context, the present work wish to compare several feature selection techniques in SVMs applied to microarray data. Besides, during this research, 2 new techniques based on genetic algorithms for selecting genes were developed. The experiments showed that most of the tested techniques was able to gratefully reduce the dimensionality of the gene expression data without degradation of SVM performance. Biblioteca Digitais de Teses e Dissertações da USP Carvalho, André Carlos Ponce de Leon Ferreira de 2005-05-06 Dissertação de Mestrado application/pdf http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ pt Liberar o conteúdo para acesso público. |
collection |
NDLTD |
language |
pt |
format |
Others
|
sources |
NDLTD |
topic |
Não disponível Not available |
spellingShingle |
Não disponível Not available Souza, Bruno Feres de Seleção de características em SVMs aplicadas a dados de expressão gênica |
description |
Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classificação é realizada com a ajuda de algoritmos de AMáquina (AM), como as Máquinas de Vetores de Suporte, ou simplesmente SVMs. Uma particularidade dos dados de expressão gênica é que a quantidade de amostras utilizadas pelo algoritmo de aprendizado é, normalmente, muitas vezes inferior à quantidade de características consideradas, o que pode deteriorar o desempenho dos algoritmos de AM e dificultar a compreensão dos dados. Neste contexto, o presente trabalho visa à comparação de diversas técnicas de seleção de características (SC) em SVMs aplicadas a dados microarrays. Além disso, durante a pesquisa, foram desenvolvidas 2 novas técnicas de SC baseadas em algoritmos genéticos. Os experimentos demonstram que a maioria das técnicas testadas é capaz de reduzir sobremaneira a dimensionalidade dos dados de expressão gênica sem prejudicar o desempenho das SVMs. === Recently, a lot of large scale gene expression analysis technologies have been introducted. Microarrays are among the most used ones. Among their most common applications, one can highlight the classificaiion of tissue samples, which is essential to the correct identification of the câncer type. This classification is carried out by Machine Learning (ML) algorithms, like the Support Vector Machines (SVMs). Gene expression data are characterized by an disproportionate rate between the number of tissue samples and the dimensionality of the domain, which can hurt the performance of the ML algorithms. In this context, the present work wish to compare several feature selection techniques in SVMs applied to microarray data. Besides, during this research, 2 new techniques based on genetic algorithms for selecting genes were developed. The experiments showed that most of the tested techniques was able to gratefully reduce the dimensionality of the gene expression data without degradation of SVM performance. |
author2 |
Carvalho, André Carlos Ponce de Leon Ferreira de |
author_facet |
Carvalho, André Carlos Ponce de Leon Ferreira de Souza, Bruno Feres de |
author |
Souza, Bruno Feres de |
author_sort |
Souza, Bruno Feres de |
title |
Seleção de características em SVMs aplicadas a dados de expressão gênica |
title_short |
Seleção de características em SVMs aplicadas a dados de expressão gênica |
title_full |
Seleção de características em SVMs aplicadas a dados de expressão gênica |
title_fullStr |
Seleção de características em SVMs aplicadas a dados de expressão gênica |
title_full_unstemmed |
Seleção de características em SVMs aplicadas a dados de expressão gênica |
title_sort |
seleção de características em svms aplicadas a dados de expressão gênica |
publisher |
Biblioteca Digitais de Teses e Dissertações da USP |
publishDate |
2005 |
url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ |
work_keys_str_mv |
AT souzabrunoferesde selecaodecaracteristicasemsvmsaplicadasadadosdeexpressaogenica AT souzabrunoferesde featureselectioninsupportvectormachinesappliedtothegeneexpressiondata |
_version_ |
1719066648184356864 |