Metodología para el minado in silico de loci polimórficos en microsatélites

<p><strong>Resumen</strong></p><p><strong>Antecedentes</strong>: Los polimorfismos con número variable de repeticiones en tándem (VNTR), particularmente los de microsatélites (SSR), constituyen marcadores genéticos ampliamente utilizados en múltiples áreas d...

Full description

Bibliographic Details
Main Authors: MSc. Prof. Carlos Miguel Martínez Ortiz, Alejandro Rivero Bandínez
Format: Article
Language:English
Published: ECIMED 2019-06-01
Series:Revista Cubana de Informática Médica
Online Access:http://www.revinformatica.sld.cu/index.php/rcim/article/view/325
Description
Summary:<p><strong>Resumen</strong></p><p><strong>Antecedentes</strong>: Los polimorfismos con número variable de repeticiones en tándem (VNTR), particularmente los de microsatélites (SSR), constituyen marcadores genéticos ampliamente utilizados en múltiples áreas de la genómica como estudios evolutivos, epidemiológicos y de genética poblacional. El crecimiento exponencial de los bancos de secuencias genómicas y las herramientas computacionales como BLAST permiten actualmente el minado de estos marcadores sin necesidad de utilizar métodos experimentales, extendiéndolo a organismos no modelos de importancia médica o económica. No obstante, debido a la baja complejidad de estas secuencias y el elevado número de candidatos que se presentan al inspeccionar un genoma cuando el procedimiento es escalado, surgen serias dificultades para el procesamiento del enorme volumen de datos que se genera y la detección por inspección visual de los polimorfismos en los marcadores candidatos.</p><p><strong>Métodos</strong>: Se describe una metodología y sus especificidades algorítmicas, implementadas en varios software que, ejecutados en serie, permiten la identificación y extracción rápida y fiable de <em>loci</em> polimórficos de SSRs. El procesamiento global se hace por la concatenación de los programas MIDAS, BLAST, y el <em>script</em> PSSR-Extractor. Las entradas son rutas de directorios donde se encuentren múltiples archivos de secuencia en formato FASTA o GBFF y las salidas son los SSRs, códigos de acceso al GenBank, posiciones en el genoma, número de repeticiones y el grado de polimorfismo expresado como rango de variación, frecuencia alélica, cantidad de alelos y contenido de información polimórfica (PIC). Un <em>script</em> opcional, SSRMerge, permite la identificación de <em>loci</em> únicos (no redundantes) a nivel de especie, de género o en general del conjunto las secuencias que se desee procesar.</p><p><strong>Resultados</strong>: Se procesaron 23 genomas completos (RefSeq del NCBI) pertenecientes a diversos aislamientos de <em>Mycobacterium tuberculosis</em>. Se detectaron 4433 SSRs y de ellos se extrajeron 414 <em>loci</em> no redundantes dentro de la especie. Se hizo el minado de polimorfismos en las salidas del servidor BLAST para estos SSRs y se reportan diferentes medidas que reflejan las variaciones que presentan estos <em>loci</em>.</p>
ISSN:1684-1859