Summary: | Made available in DSpace on 2015-03-26T13:42:30Z (GMT). No. of bitstreams: 1
texto completo.pdf: 3476957 bytes, checksum: 7b79218599a11932aefca465d11aafc6 (MD5)
Previous issue date: 2013-07-29 === Coordenação de Aperfeiçoamento de Pessoal de Nível Superior === The present work reports results from the research developed at the "International consortium for the sequencing of the genome and transcriptome of the common bean (Phaseolus vulgaris)" (Prosul/CNPq and CYTED) project conducted at Embrapa Rice and Beans (CNPAF) and the Federal University of Viçosa (UFV), which is composed of two distinct subprojects: Sequencing and characterization of the BACs-ends and Identification and development of SNPs markers in common bean . The dissert were structured in two chapters, each derived from their respective subprojects, containing the objectives and the main results presented below: Chapter 1- With the intention of amplifying and deepening the understanding about the P. vulgaris genome structure and composition, the goal of this study was to generate BAC-end sequences (BESs) from one BAC (Bacterial Artificial Chromosome) library and analyze the sequences for the presence of SSRs and genomic annotation. In total, 52,270 BESs were generated and processed equaling 32 Mbp (6.5%) of the P. vulgaris genome, with 39% of GC content. A total of 3,789 BES-SSRs were found, one for every 8.36 kb. Of these, 2,000 SSRs were appropriated for the development of molecular markers, of these 194 were evaluated and 40 were characterized for genetic and operational aspects. Of the 52,270 BESs, approximately, 2% contained sequences that encode transcription factors and 3% contained transposable elements. Through the comparison with the NCBI non-redundant protein database, it was possible to identify putative functions for 24,321 BESs, accounting for 46.53% of the total sequences analyzed. According to Gene Ontology (GO) terms functional categories were assigned to 19,363 BESs involved in biological process (52%), molecular function (65%) and cellular component (22%). This study allowed us to successfully identify BES-SSRs, highly polymorphic, searching for SSRs motifs of tri- to hexanucleotides, adding appropriate genetic features and with the potential to be used in the common bean genetic breeding programs. Additionally, the generated and processed BESs were integrated into the international project of common bean genome sequencing assisting in the composition and assembly of the genome. Chapter 2- The objectives of this study were to evaluate and compare the informativeness of 58 SSRs (24 SSRs-di dinucleotide microsatellites and 34 BES-SSRs tri- to hexanucleotide microsatellites) and 345 SNPs, as suited tools to P. vulgaris breeding programs. A germplasm set of 88 genotypes compounded of 55 breeding material and 33 landraces was evaluated, including eight biparental combinations derived from inter and intra-gene pool crosses. The SSRs-di displayed higher average of alleles/locus (9.916) and gene diversity (72.1%), exhibiting a superior capacity to distinguish the whole group of genotypes. Fourteen SSRs, out of the 58, with a considerable number of private alleles (over 14.93/locus) and high levels of gene diversity (84%), discriminated all 88 genotypes. The polymorphic SNPs, among inter (78.2%) and intra-gene pool (17.7%) combinations, were evaluated concerning their employment in genetic mapping. The approaches utilized to infer the genetic population structure presented correspondent results among all classes of markers, differentiating the genotypes within Andean and Mesoamerican gene pools. The SNPs, however, evidenced a superior (K = 2, FST = 0.895) competence to differentiate between the two gene pools. Furthermore, the SSRs-di distinguished, within Mesoamerican gene pool, the breeding material and the landraces germplasm (K = 3). Despite the high levels of linkage disequilibrium for both SSRs and SNPs, the latter yielded higher levels (84.92%). The linkage disequilibrium levels dropped when Andean and Mesoamerican genotypes were analyzed separately. The SSRs and SNPs distribution in P. vulgaris genome was abundant and random. Concerning the breeding program, SSRs and SNPs genotyping panels are now available, allowing the germplasm origin to be disclosed. In addition, a group of polymorphic SNPs, between several biparental populations, presents itself as an extension of such technology in the development of high-density genetic maps, with a substantial marker overlapping through crosses. This study contributes for the integration of genomic tools within breeding programs, connecting feasible and low cost techniques with efficient/wide genome sampling of the common bean. === Este trabalho apresenta resultados de pesquisas desenvolvidas no âmbito do Projeto Consórcio internacional para o sequenciamento do genoma e do transcriptoma do feijoeiro comum (Phaseolus vulgaris) (Prosul/CNPq e CYTED) conduzido na Embrapa Arroz e Feijão (CNPAF) e na Universidade Federal de Viçosa (UFV), sendo este composto por dois subprojetos distintos: Sequenciamento e caracterização das pontas de BACs e Identificação e desenvolvimento de marcadores SNPs em feijoeiro comum . A dissertação foi estruturada em dois capítulos, cada um derivado de um subprojeto, contendo os objetivos e os principais resultados apresentados a seguir: Capítulo 1- Com o intuito de ampliar e aprofundar o conhecimento sobre a estrutura e composição do genoma de P. vulgaris este estudo teve como objetivo sequenciar uma biblioteca BAC (Bacterial Artificial Chromosome) a partir de suas extremidades (BESs BAC-end sequences) e analisar as sequências quanto à presença de SSRs e a anotação genômica. Ao todo, 52.270 BESs foram geradas e processadas equivalendo a 32 Mpb (6,5%) do genoma de P. vulgaris, com conteúdo de GC estimado em 39%. Foram encontrados um total de 3.789 BES-SSRs, um a cada 8,36 kb. Destes, 2.000 foram adequados para o desenvolvimento de marcadores moleculares, dos quais 194 foram avaliados e 40 deles foram caracterizados quanto a aspectos genéticos operacionais. Das 52.270 BESs, aproximadamente 2% continham sequências que codificavam fatores de transcrição e 3% continham elementos transponíveis. Através da comparação com o banco de dados não-redundante de proteínas do NCBI, foi possível identificar funções putativas para 24.321 BESs, contabilizando 46,53% do total de sequências analisadas. Com base nos termos do Gene Ontology (GO), foram atribuídas categorias funcionais a 19.363 BESs inseridas em processos biológicos (52%), função molecular (65%) e componente celular (22%). Este estudo permitiu identificar com sucesso BES-SSRs altamente polimórficos, buscando motivos SSRs de tri- a hexanucleotídeos, agregando características genéticas adequadas e com potencial de serem utilizados no programa de melhoramento genético de feijoeiro comum. Adicionalmente, as BESs geradas e processadas foram integradas ao projeto internacional de sequenciamento do genoma de feijoeiro comum auxiliando na composição e montagem do mesmo. Capítulo 2- O objetivo desse estudo foi avaliar e comparar o poder de informação genética de um grupo de 58 marcadores SSRs (24 SSRs-di microssatélites dinucleotídeo e 34 BES-SSRs microssatélites tri- a hexanucleoídeo) e 345 SNPs para aplicações no melhoramento genético de P. vulgaris. Foram avaliados 88 genótipos representativos de 55 acessos melhorados e 33 variedades tradicionais, incluindo oito combinações biparentais composta por cruzamentos inter- e intra-pool gênico. Os SSRs-di apresentaram maior média de alelos por loco gênico (9,916) e revelaram maior diversidade genética média (72,1%), sendo o grupo de marcadores com o maior poder de discriminação genética entre indivíduos. Entre os 58 SSRs, 14 com uma elevada média de alelos privativos (14,93/loco) e diversidade genética (84%) possibilitaram a discriminação individual dos 88 genótipos. Os SNPs polimórficos entre cruzamentos biparentais, intra- (17,7%) e inter-pool gênico (78,2%), foram avaliados quanto à aplicação prática no mapeamento genético. As abordagens utilizadas para inferir a estrutura genética populacional apresentaram resultados similares entre os grupos de marcadores, discriminando os genótipos nos pools gênicos Mesoamericano e Andino, com a maior diferenciação genética (K = 2, FST = 0,895) apresentada pelos SNPs. Os SSRs- di possibilitaram discriminar dentro do pool gênico Mesoamenricano o germoplasma melhorado e tradicional (K = 3). O desequilíbrio de ligação testado para todos os marcadores foi elevado, sendo maior para os SNPs (84,92%), reduzindo significativamente quando avaliado separadamente para os genótipos Andinos e Mesoamericanos. A distribuição dos SSRs e SNPs foi ampla e aleatória em todo o genoma de P. vulgaris. Em termos de resultados práticos para o programa de melhoramento, neste estudo foram derivados painéis de genotipagem operacionais baseado em SSRs e SNPs com alto e eficiente poder de discriminação do germoplasma por origem. Adicionalmente, um conjunto de SNPs polimórficos entre diversas populações biparentais representa uma aplicação adicional dessa tecnologia para geração de mapas genéticos de alta densidade compreendendo uma proporção substancial de marcadores compartilhados entre cruzamentos. Esse estudo contribui para a integração crescente da genômica nos programas de melhoramento, aliando metodologias de genotipagem acessíveis e a baixos custos que permitem amostrar de modo eficiente e/ou amplo o genoma de feijoeiro comum.
|