Seleção de características em SVMs aplicadas a dados de expressão gênica
Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classi...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade de São Paulo
2005
|
Subjects: | |
Online Access: | http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ |
id |
ndltd-IBICT-oai-teses.usp.br-tde-18112014-144007 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-teses.usp.br-tde-18112014-1440072019-01-21T22:09:40Z Seleção de características em SVMs aplicadas a dados de expressão gênica Feature selection in support vector machines applied to the gene expression data Bruno Feres de Souza André Carlos Ponce de Leon Ferreira de Carvalho Roberto Marcondes Cesar Junior Alexandre Cláudio Botazzo Delbem Não disponível Not available Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classificação é realizada com a ajuda de algoritmos de AMáquina (AM), como as Máquinas de Vetores de Suporte, ou simplesmente SVMs. Uma particularidade dos dados de expressão gênica é que a quantidade de amostras utilizadas pelo algoritmo de aprendizado é, normalmente, muitas vezes inferior à quantidade de características consideradas, o que pode deteriorar o desempenho dos algoritmos de AM e dificultar a compreensão dos dados. Neste contexto, o presente trabalho visa à comparação de diversas técnicas de seleção de características (SC) em SVMs aplicadas a dados microarrays. Além disso, durante a pesquisa, foram desenvolvidas 2 novas técnicas de SC baseadas em algoritmos genéticos. Os experimentos demonstram que a maioria das técnicas testadas é capaz de reduzir sobremaneira a dimensionalidade dos dados de expressão gênica sem prejudicar o desempenho das SVMs. Recently, a lot of large scale gene expression analysis technologies have been introducted. Microarrays are among the most used ones. Among their most common applications, one can highlight the classificaiion of tissue samples, which is essential to the correct identification of the câncer type. This classification is carried out by Machine Learning (ML) algorithms, like the Support Vector Machines (SVMs). Gene expression data are characterized by an disproportionate rate between the number of tissue samples and the dimensionality of the domain, which can hurt the performance of the ML algorithms. In this context, the present work wish to compare several feature selection techniques in SVMs applied to microarray data. Besides, during this research, 2 new techniques based on genetic algorithms for selecting genes were developed. The experiments showed that most of the tested techniques was able to gratefully reduce the dimensionality of the gene expression data without degradation of SVM performance. 2005-05-06 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ por info:eu-repo/semantics/openAccess Universidade de São Paulo Ciências da Computação e Matemática Computacional USP BR reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo instacron:USP |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Não disponível
Not available |
spellingShingle |
Não disponível
Not available Bruno Feres de Souza Seleção de características em SVMs aplicadas a dados de expressão gênica |
description |
Recentemente, diversas tecnologias de análise de expressão gênica têm sido introduzidas. Os miroarrays estão entre as mais utilizadas. Dentre suas aplicações mais comuns, pode-se destacar a classificação de amostras de tecido, essencial para a identificação correta do tipo de câncer. Esta classificação é realizada com a ajuda de algoritmos de AMáquina (AM), como as Máquinas de Vetores de Suporte, ou simplesmente SVMs. Uma particularidade dos dados de expressão gênica é que a quantidade de amostras utilizadas pelo algoritmo de aprendizado é, normalmente, muitas vezes inferior à quantidade de características consideradas, o que pode deteriorar o desempenho dos algoritmos de AM e dificultar a compreensão dos dados. Neste contexto, o presente trabalho visa à comparação de diversas técnicas de seleção de características (SC) em SVMs aplicadas a dados microarrays. Além disso, durante a pesquisa, foram desenvolvidas 2 novas técnicas de SC baseadas em algoritmos genéticos. Os experimentos demonstram que a maioria das técnicas testadas é capaz de reduzir sobremaneira a dimensionalidade dos dados de expressão gênica sem prejudicar o desempenho das SVMs.
===
Recently, a lot of large scale gene expression analysis technologies have been introducted. Microarrays are among the most used ones. Among their most common applications, one can highlight the classificaiion of tissue samples, which is essential to the correct identification of the câncer type. This classification is carried out by Machine Learning (ML) algorithms, like the Support Vector Machines (SVMs). Gene expression data are characterized by an disproportionate rate between the number of tissue samples and the dimensionality of the domain, which can hurt the performance of the ML algorithms. In this context, the present work wish to compare several feature selection techniques in SVMs applied to microarray data. Besides, during this research, 2 new techniques based on genetic algorithms for selecting genes were developed. The experiments showed that most of the tested techniques was able to gratefully reduce the dimensionality of the gene expression data without degradation of SVM performance.
|
author2 |
André Carlos Ponce de Leon Ferreira de Carvalho |
author_facet |
André Carlos Ponce de Leon Ferreira de Carvalho Bruno Feres de Souza |
author |
Bruno Feres de Souza |
author_sort |
Bruno Feres de Souza |
title |
Seleção de características em SVMs aplicadas a dados de expressão gênica
|
title_short |
Seleção de características em SVMs aplicadas a dados de expressão gênica
|
title_full |
Seleção de características em SVMs aplicadas a dados de expressão gênica
|
title_fullStr |
Seleção de características em SVMs aplicadas a dados de expressão gênica
|
title_full_unstemmed |
Seleção de características em SVMs aplicadas a dados de expressão gênica
|
title_sort |
seleção de características em svms aplicadas a dados de expressão gênica |
publisher |
Universidade de São Paulo |
publishDate |
2005 |
url |
http://www.teses.usp.br/teses/disponiveis/55/55134/tde-18112014-144007/ |
work_keys_str_mv |
AT brunoferesdesouza selecaodecaracteristicasemsvmsaplicadasadadosdeexpressaogenica AT brunoferesdesouza featureselectioninsupportvectormachinesappliedtothegeneexpressiondata |
_version_ |
1718891478164439040 |