Um algoritmo algébrico para o Problema da Distância de Transposição em Rearranjo de Genomas

Dissertação (Mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação Mestrado em Informática, 2013. === Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2014-04-16T13:34:05Z No. of bitstreams: 1 2013_LuizAugustoGarciaSilva.pdf: 810446 byte...

Full description

Bibliographic Details
Main Author: Silva, Luiz Augusto Garcia da
Other Authors: Walter, Maria Emília Machado Telles
Language:Portuguese
Published: 2014
Subjects:
Online Access:http://repositorio.unb.br/handle/10482/15463
Description
Summary:Dissertação (Mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação Mestrado em Informática, 2013. === Submitted by Albânia Cézar de Melo (albania@bce.unb.br) on 2014-04-16T13:34:05Z No. of bitstreams: 1 2013_LuizAugustoGarciaSilva.pdf: 810446 bytes, checksum: 291c6f45324fb72ea0a2f50ea0f10dc2 (MD5) === Approved for entry into archive by Guimaraes Jacqueline(jacqueline.guimaraes@bce.unb.br) on 2014-04-16T14:54:51Z (GMT) No. of bitstreams: 1 2013_LuizAugustoGarciaSilva.pdf: 810446 bytes, checksum: 291c6f45324fb72ea0a2f50ea0f10dc2 (MD5) === Made available in DSpace on 2014-04-16T14:54:51Z (GMT). No. of bitstreams: 1 2013_LuizAugustoGarciaSilva.pdf: 810446 bytes, checksum: 291c6f45324fb72ea0a2f50ea0f10dc2 (MD5) === Em Biologia Computacional, eventos mutacionais afetando grandes porções de um genoma são estudados na área de Rearranjo de Genomas. Particularmente, a transposição é um evento mutacional que troca de posição dois blocos contíguos de genes em um cromossomo. Este evento gera o problema da distância de transposição (PDT), que consiste em encontrar o número mínimo de transposições necessárias para transformar um cromossomo em outro. Recentemente, foi mostrado que o PDT é NP-difícil. Na literatura, muitos algoritmos foram propostos para resolver este problema, seguindo abordagens diferentes. Neste trabalho, utilizaremos o formalismo algébrico proposto por Meidanis e Dias, para a modelagem de cromossomos e transposições, e resultados clássicos de Grupos de Permutações para propor um algoritmo de aproximação com razão 2 para o problema da distância de transposição. Embora existam algoritmos com razão de aproximação melhores, a contribuição do presente trabalho é teórica, pois propõe uma solução para o problema da distância de transposição utilizando apenas resultados conhecidos de Teoria de Grupos de Permuta- ções, desvinculada do formalismo clássico Bafna e Pevzner. É importante notar que nosso algoritmo simula, de forma natural, a solução baseada em grafo de ciclos de Bafna e Pevzner. Nossa solução poderá ser automatizada em parte, e acreditamos que indica caminhos novos, que possibilitarão tanto diminuir a razão de aproximação quanto obter uma outra prova usando resultados de Grupos de Permutações para mostrar que o problema da distância de transposição é NP-difícil. O algoritmo proposto foi implementado na linguagem de programação Java. Utilizamos um sistema de álgebra computacional, chamado GAP, para computar operações envolvendo permutações. O algoritmo foi auditado na ferramenta GRAAu, o que permitiu a comparação de todas as distâncias de transposições dadas por nosso algoritmo, para todas as permutações de tamanho 2 até 11, com os valores exatos. Os resultados dessa auditoria foram comparados com outros encontrados na literatura. ______________________________________________________________________________ ABSTRACT === In computational biology, mutational events a ecting large portions of a genome are studied in genome rearrangements. Particularly, transposition is a mutational event that changes two contiguous blocks of genes inside a single chromosome. This event generates the problem of transposition distance, which is to nd the minimum number of transpositions transforming a chromosome into another. Recently, this problem was proved to be NP-hard. In the literature many algorithms were proposed to solve this problem, taking into account di erent approaches. In the present work, we will use the algebraic formalism for chromosome modeling and transpositions proposed by Meidanis and Dias, and classic results of Permutation Groups to suggest a 2-approximation algorithm for the transposition distance problem. Although there are better approximation algorithms, the contribution of this work is the proposition of a solution to the transposition distance problem using only known results of Permutation Groups Theory, dissociated from the classic formalism proposed by Bafna and Pevzner. It is worth noting that our algorithm simulates, in a natural way, the solution based on Bafna and Pevzner's cycle graph. Our solution can be automated in part, and we believe that it indicates new ways that enable to decrease the approximation ratio and to achieve another proof, using results of Permutation Groups, to show that the problem of transposition distance is NP-hard. The proposed algorithm was implemented using Java programming language. We have used a computer algebra system, called GAP, to compute operations involving permutations. The algorithm was also audited in GRAAu tool, which allowed the comparison of all transposition distances given by our algorithm, for all permutations of size 2 to 11, with the exact values. The results of this audit were compared with others found in the literature.