Medidas de distância e algoritmos de agrupamento na caracterização e avaliação de germoplasma de Capsicum spp

Com o aumento da perda da variabilidade genética, devido a queimadas, desmatamentos e a procura por genótipos mais adaptados e produtivos a caracterização e a avaliação dos genótipos conservados em um banco de germoplasma são de elevada importância. A caracterização e a avaliação podem ser obtidas d...

Full description

Bibliographic Details
Main Author: Fabrizio Malaghini Aranha
Other Authors: Leandro Simões Azeredo Gonçalves .
Language:Portuguese
Published: Universidade Estadual de Londrina. Centro de Ciências Agrárias. Programa de Pós-Graduação em Agronomia. 2015
Online Access:http://www.bibliotecadigital.uel.br/document/?code=vtls000203606
Description
Summary:Com o aumento da perda da variabilidade genética, devido a queimadas, desmatamentos e a procura por genótipos mais adaptados e produtivos a caracterização e a avaliação dos genótipos conservados em um banco de germoplasma são de elevada importância. A caracterização e a avaliação podem ser obtidas de várias formas, gerando, eventualmente, dados quantitativos e qualitativos. Uma análise conjunta dessas variáveis pode ser considerada uma excelente estratégia para a avalição do germoplasma. Dessa forma, esse trabalho foi desenvolvido com o objetivo de avaliar diferentes medidas de distância e agrupamentos para caracterização e avaliação de acessos de Capsicum spp.. Foram utilizados dados de caracterização de uma coleção de 54 acessos de Capsicum spp. do banco de germoplasma da Universidade Estadual do Norte Fluminense Darcy Ribeiro (UENF). As distâncias utilizadas foram seis quantitativas (A1 – média das diferenças absoluta dos rank-padronizados, A2 – correlação de Pearson, A3 – Kulczynski, A4 – Canberra, A5 – Bray-Curtis, e A6 – Morisita) combinadas com a distância para dados qualitativos – Coincidência Simples (B1). Os agrupamentos foram realizados pelos métodos hierárquicos aglomerativos (UPGMA, e Ward) e não-hierárquicos (K-médias e PCAmix). Todas as distâncias combinadas foram altamente correlacionadas. Pelo coeficiente de correlação cofenética entre as matrizes de agrupamentos hierárquicos e de distância combinada, o agrupamento UPGMA obteve os maiores valores, entretanto aplicando o coeficiente aglomerativo, o agrupamento Ward obteve os maiores valores em relação ao UPGMA. Quando foi utilizado como metodologia a representação gráfica da área sob a função da densidade acumulativa na determinação do número ótimo de grupos com diferentes distâncias combinadas, três grupos foram considerados como número ideal para maioria dos agrupamentos. Apenas para as distâncias A5B1 e A6B1 utilizando o Ward, e A5B1 utilizando K-médias não foi possível determinar o número ótimo de grupos. Comparando os agrupamentos obtidos pelo método Ward e UPGMA, verifica-se que o método Ward obteve maior eficiência em maximizar as dessemelhanças entre os complexos C. annuum e C. baccatum nas distâncias combinadas A2B1, A3B1, A5B1 e A6B1. A análise do PCAmix permitiu a separação dos acessos em relação a espécies, utilizando simultaneamente dados quantitativos e qualitativos, demostrando ser uma alternativa para análise simultânea dos dados conjuntos, visando uma comparação entre diferentes agrupamentos. === The increasing loss of genetic variability makes highly relevant the characterization and assessment of the genotypes stored in a germplasm bank. Such performance can be reached through several ways producing eventually quantitative and qualitative data. This way, a joint analysis of those variables may prove to be a significant strategy aiming at a precise characterization of the germplasm. This work had the objective to assess different distance measures and groupings for characterization and assessment of the Capsicum spp. accessions. For characterization, data were collected from a 54 accessions collection from the germplasm bank of the Universidade Estadual do Norte Fluminense Darcy Ribeiro (UENF). For this study six quantitative distances were used (A1 - absolute difference average of the standard rank, A2 – Pearson correlation, A3 – Kulczynski, A4 – Canberra, A5 – Bray-Curtis, and A6 – Morisita) and combined with distance for qualitative data – Simple Coincidence (B1). The groupings were carried out by using hierarchical agglomerative methods (UPGMA and Ward ) and non-hierarchical (K- means and PCAMIX). All the distances combined were highly correlated. From the coffenetic correlation coefficient between the hierarchical grouping matrixes and combined distance, the UPGMA groupings reached the highest values, however when applying the agglomerative coefficient the Ward groupings reached the highest values compared to UPGMA. When using graphic area representation under the accumulative density function for determining the optimal group number with different distances combined, three groups were considered as the ideal number for the majority of groupings. However, the distances A5B1 and A6B1 using Ward, and A5B1 using K-means the optimal number of groups could not be determined. By comparing the groups reached by Ward and UPGMA methods it is possible to estate that Ward method showed highest efficiency towards maximizing the dissimilarities between the C. annuum and C. baccatum complexes towards the distances combined A2B1, A3B1, A5B1 and A6B1. The analysis of the PCAmix allowed the separation of the accessions in relation to the species by using simultaneously both quantitative and qualitative data, proving to be an alternative for simultaneous analysis of mix data when seeking for a comparison between the different groupings.