Análises discriminantes não paramétricas aplicadas ao estudo da diversidade genética baseado em dados fenotípicos quantitativos

Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:08:37Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Marcileia S. Souza.pdf: 1088069 bytes, checksum: 91eb662c19983ecff2646f7798e569ea (MD5) === Ap...

Full description

Bibliographic Details
Main Authors: Souza, Marcileia Santos, 92-99325-6955
Other Authors: agronomiatropical@ufam.edu.br
Format: Others
Language:Portuguese
Published: Universidade Federal do Amazonas 2018
Subjects:
Online Access:http://tede.ufam.edu.br/handle/tede/6188
Description
Summary:Submitted by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:08:37Z No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Marcileia S. Souza.pdf: 1088069 bytes, checksum: 91eb662c19983ecff2646f7798e569ea (MD5) === Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2018-03-02T13:08:51Z (GMT) No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Marcileia S. Souza.pdf: 1088069 bytes, checksum: 91eb662c19983ecff2646f7798e569ea (MD5) === Made available in DSpace on 2018-03-02T13:08:51Z (GMT). No. of bitstreams: 2 license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Dissertação_Marcileia S. Souza.pdf: 1088069 bytes, checksum: 91eb662c19983ecff2646f7798e569ea (MD5) Previous issue date: 2017-12-04 === CNPq - Conselho Nacional de Desenvolvimento Científico e Tecnológico === The multivariate discriminant analysis methods aim to identify the populations in which an individual should belong, admitting previously, that the individual composes one of the evaluated populations. Methods based on linear discriminant functions have been used in predictive studies of diversity in genetic improvement, when the data are quantitative phenotype. However, this type of analysis presupposes the multinormality of populations. The objective of this study was to evaluate the effectiveness of the non-parametric discriminant methodologies of the middle neighbor and k-Nearest Neighbour in the predictive study of diversity in genetic improvement, when applied to quantitative variables, in order to satisfactorily (re) classify the genotypes in their respective populations defined a priori. Two sets of data were used: i) 83 pupunha matrices, previously allocated in three primitive races, for seven variables of the fruit; ii) 122 clones of coffee trees, previously allocated among three botanical varieties, for ten agronomic characteristics. The non-parametric methods of the middle neighbor and the k-Nearest Neighbour were evaluated under various scenarios, according to possible combinations between non-parametric analysis technique x genetic distance measure x k x probability a priori of the genotypes belonging to the populations. The genotype allocation was compared in the different scenarios and the one obtained by Anderson's discriminant functions (considered standard) from the global apparent error rates (TEA) of classification of the individuals in the respective populations. The GENES software was used. The nonparametric methods were effective to classify the genotypes in their respective populations when compared with Anderson's discriminant analysis method. There were no significant differences between Euclidean distances measurements. The Gower distance provided apparent error rates different from the other studied distances. The method of discriminant analysis of the k-Nearest Neighbour proved to be adequate for populations whose genetic divergence within is smaller. The middle neighbor method, however, classifies the genotypes better in populations where there is greater inter- or intra-population diversity. === Os métodos multivariados de análises discriminantes visam identificar as populações nas quais um indivíduo deva pertencer, admitindo previamente, que o indivíduo compõe uma das populações avaliadas. Métodos baseados em funções discriminantes lineares têm sido usados nos estudos preditivos da diversidade no melhoramento genético, quando os dados são fenotípicos quantitativos. Entretanto, este tipo de análise pressupõe a multinormalidade das populações. Objetivou-se avaliar a efetividade das metodologias de análise discriminante não paramétricas do vizinho médio e dos k-vizinhos mais próximos no estudo preditivo da diversidade no melhoramento genético, quando aplicadas à variáveis quantitativas, de modo a classificar satisfatoriamente os genótipos em suas respectivas populações definidas a priori. Dois conjuntos de dados foram utilizados: i) 83 matrizes de pupunha, previamente alocadas em três raças primitivas, para sete variáveis do fruto; ii) 122 clones de cafeeiro, previamente alocados entre três variedades botânicas, para dez variáveis agronômicas. Avaliou-se os métodos não paramétricos do vizinho médio e dos k-vizinhos mais próximos sob vários cenários, conforme combinações possíveis entre técnica de análise não paramétrica x medida de distância genética x valor de k x probabilidade a priori dos genótipos pertencerem as populações. Comparou-se a alocação dos genótipos nos diferentes cenários e com aquela obtida pelas funções discriminantes de Anderson (considerada padrão) a partir das taxas de erro aparente globais (TEA) de classificação dos indivíduos nas respectivas populações. Utilizou-se o software GENES. Os métodos não paramétricos foram efetivos para classificar os genótipos em suas respectivas populações quando comparados com o método de análise discriminante de Anderson. Não houve diferenças significativas entre as medidas de distâncias Euclidianas. A distância de Gower proporcionou taxas de erro aparente diferente das demais distâncias estudadas. O método de análise discriminante dos k vizinhos mais próximos mostrou ser adequado para populações cuja divergência genética dentro é menor. Já o método do vizinho médio classifica melhor os genótipos em populações em que haja maior diversidade inter ou intrapopulacional.