Mineração de dados usando álgebra linear para a predição de alvos drogáveis

=== This work presents the development of a method for recovering target proteins that are druggable. From the representation of drug targets defined as vectors by using InterPro annotations, tools of linear algebra related to singular value decomposition are used to organize the semantic vector sp...

Full description

Bibliographic Details
Main Author: Eduardo Campos dos Santos
Other Authors: Julio Cesar Dias Lopes
Format: Others
Language:Portuguese
Published: Universidade Federal de Minas Gerais 2012
Online Access:http://hdl.handle.net/1843/BUBD-9DKGUW
Description
Summary:=== This work presents the development of a method for recovering target proteins that are druggable. From the representation of drug targets defined as vectors by using InterPro annotations, tools of linear algebra related to singular value decomposition are used to organize the semantic vector space and allow the efficient recovery of proteins related to a given query. Not prima facie relationships arise and indicate drug repositioning opportunities, rational development strategies and, the prediction of potential druggable targets and latent side-effects. The InterPro signatures which are most relevant to drug target/non-drug target discriminating were selected by logistic regression. The results are statistically evaluated by ROC curves analysis and data corroborated in the literature. === Apresenta-se o desenvolvimento de um método para recuperar proteínas que são alvos drogáveis. A partir da representação desses alvos como vetores definidos a partir das anotações do InterPro, instrumentos da álgebra linear relacionados com a decomposição por valores singulares são utilizados para organizar semanticamente o espaço vetorial e permitir a recuperação eficiente das proteínas similares a uma dada consulta. Relações não observadas prima facie são descortinadas indicando, oportunidades para reposicionamento de fármacos conhecidos, estratégias para o desenvolvimento racional de novos compostos e a predição de potenciais alvos drogáveis e de efeitos colaterais latentes. As assinaturas do InterPro mais relevantes para discriminar alvos drogáveis e não-drogáveis foram determinadas por regressão logística. Os resultados são avaliados estatisticamente por análise de curvas ROC e dados corroborados em outros trabalhos.