Summary: | Em muitas representações de objetos ou sistemas físicos se faz necessário a utilização de técnicas de redução de dimensionalidade que possibilitam a análise dos dados
em baixas dimensões, capturando os parâmetros essenciais associados ao problema. No
contexto de aprendizagem de máquina esta redução se destina primordialmente à clusterização, reconhecimento e reconstrução de sinais. Esta tese faz uma análise meticulosa
destes tópicos e suas conexões que se encontram em verdadeira ebulição na literatura,
sendo o mapeamento de difusão o foco principal deste trabalho. Tal método é construído
a partir de um grafo onde os vértices são os sinais (dados do problema) e o peso das arestas
é estabelecido a partir do núcleo gaussiano da equação do calor. Além disso, um processo
de Markov é estabelecido o que permite a visualização do problema em diferentes escalas
conforme variação de um determinado parâmetro t: Um outro parâmetro de escala, Є,
para o núcleo gaussiano é avaliado com cuidado relacionando-o com a dinâmica de Markov
de forma a poder aprender a variedade que eventualmente seja o suporte do dados.
Nesta tese é proposto o reconhecimento de imagens digitais envolvendo transformações
de rotação e variação de iluminação. Também o problema da reconstrução de sinais é
atacado com a proposta de pré-imagem utilizando-se da otimização de uma função custo
com um parâmetro regularizador,
γ, que leva em conta também o conjunto de dados iniciais. === In many representations of objects or physical systems it is necessary to use techniques
of dimensionality reduction that enable the analysis of data at low dimensions,
capturing the essential parameters associated with the problem. Within the context of
machine learning this reduction is primarily intended for clustering , recognition and reconstruction
of signals. This thesis makes a thorough analysis of these topics and their
connections which are true boiling in the literature, the difusion mapping being the main
focus of this work . This method is constructed from a graph where the vertices are
the signs ( problem data ) and the weight of edges is established based on the Gaussian
kernel of the heat equation. Furthermore , a Markov process is established which allows
the visualization of the problem at diferent scales according to the variation of a given
parameter t . Another scale parameter, Є , for the Gaussian core is carefully evaluated by
relating it to the dynamic Markov so you can learn the variety that eventually support
the data. This thesis proposed the recognition of digital images involving transformations
of rotation and variation of illumination. Also the problem of reconstruction of signals is
attacked with the proposed pre - image using the optimization of a cost function with a
smoothing parameter, γ, Which also takes into account the initial dataset.
|