Estudo dimensional de características aplicadas à leitura labial automática

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES === This work is a study of the relationship between the intrinsic dimension of feature vectors applied to the classification of video signals in order to perform lip reading. In pattern recognition tasks, the extraction of releva...

Full description

Bibliographic Details
Main Author: Madureira, Fillipe Levi Guedes
Other Authors: Montalvão Filho, Jugurta Rosa
Language:Portuguese
Published: Pós-Graduação em Engenharia Elétrica 2018
Subjects:
Online Access:http://ri.ufs.br/jspui/handle/riufs/9567
id ndltd-IBICT-oai-ri.ufs.br-riufs-9567
record_format oai_dc
spelling ndltd-IBICT-oai-ri.ufs.br-riufs-95672019-01-21T19:55:49Z Estudo dimensional de características aplicadas à leitura labial automática Madureira, Fillipe Levi Guedes Montalvão Filho, Jugurta Rosa Engenharia elétrica Surdos Comunicação oral Sistemas de reconhecimento de padrões Dimensão intrínseca Extração de características Leitura labial Hidden Markov Model (HMM) Intrinsic dimension Feature extraction Lip-reading ENGENHARIAS::ENGENHARIA ELETRICA Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES This work is a study of the relationship between the intrinsic dimension of feature vectors applied to the classification of video signals in order to perform lip reading. In pattern recognition tasks, the extraction of relevant features is crucial for a good performance of the classifiers. The starting point of this work was the reproduction of the work of J.R. Movellan [1], which classifies lips gestures with HMM using only the video signal from the Tulips1 database. The database consists of videos of volunteers’ mouths while they utter the first 4 numerals in English. The original work uses feature vectors of high dimensionality in relation to the size of the database. Consequently, the adjustment of HMM classifiers has become problematic and the maximum accuracy was only 66.67%. Alternative strategies for feature extraction and classification schemes were proposed in order to analyze the influence of the intrinsic dimension in the performance of classifiers. The best solution, in terms of results, achieved an accuracy of approximately 83%. Este trabalho é um estudo da relação entre a dimensão intrínseca de vetores de características aplicados à classificação de sinais de vídeo no intuito de realizar-se a leitura labial. Nas tarefas de reconhecimento de padrões, a extração de características relevantes é crucial para um bom desempenho dos classificadores. O ponto de partida deste trabalho foi a reprodução do trabalho de J.R. Movellan [1], que realiza a classificação de gestos labiais com HMM na base de dados Tulips1, utilizando somente o sinal de vídeo. A base é composta por vídeos das bocas de voluntários enquanto esses pronunciam os primeiros 4 numerais em inglês. O trabalho original utiliza vetores de características de dimensão muito alta em relação ao tamanho da base. Consequentemente, o ajuste de classificadores HMM se tornou problemático e só se alcançou 66,67% de acurácia. Estratégias de extração de características e esquemas de classificação alternativos foram propostos, a fim de analisar a influência da dimensão intrínseca no desempenho de classificadores. A melhor solução, em termos de resultados, obteve uma acurácia de aproximadamente 83%. São Cristóvão, SE 2018-11-06T19:24:06Z 2018-11-06T19:24:06Z 2018-08-31 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis MADUREIRA, Fillipe Levi Guedes. Estudo dimensional de características aplicadas à leitura labial automática. 2018. 64 f. Dissertação (Mestrado em Engenharia Elétrica)–Universidade Federal de Sergipe, São Cristóvão, SE, 2018. http://ri.ufs.br/jspui/handle/riufs/9567 por info:eu-repo/semantics/openAccess Pós-Graduação em Engenharia Elétrica UFS reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe instacron:UFS
collection NDLTD
language Portuguese
sources NDLTD
topic Engenharia elétrica
Surdos
Comunicação oral
Sistemas de reconhecimento de padrões
Dimensão intrínseca
Extração de características
Leitura labial
Hidden Markov Model (HMM)
Intrinsic dimension
Feature extraction
Lip-reading
ENGENHARIAS::ENGENHARIA ELETRICA
spellingShingle Engenharia elétrica
Surdos
Comunicação oral
Sistemas de reconhecimento de padrões
Dimensão intrínseca
Extração de características
Leitura labial
Hidden Markov Model (HMM)
Intrinsic dimension
Feature extraction
Lip-reading
ENGENHARIAS::ENGENHARIA ELETRICA
Madureira, Fillipe Levi Guedes
Estudo dimensional de características aplicadas à leitura labial automática
description Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES === This work is a study of the relationship between the intrinsic dimension of feature vectors applied to the classification of video signals in order to perform lip reading. In pattern recognition tasks, the extraction of relevant features is crucial for a good performance of the classifiers. The starting point of this work was the reproduction of the work of J.R. Movellan [1], which classifies lips gestures with HMM using only the video signal from the Tulips1 database. The database consists of videos of volunteers’ mouths while they utter the first 4 numerals in English. The original work uses feature vectors of high dimensionality in relation to the size of the database. Consequently, the adjustment of HMM classifiers has become problematic and the maximum accuracy was only 66.67%. Alternative strategies for feature extraction and classification schemes were proposed in order to analyze the influence of the intrinsic dimension in the performance of classifiers. The best solution, in terms of results, achieved an accuracy of approximately 83%. === Este trabalho é um estudo da relação entre a dimensão intrínseca de vetores de características aplicados à classificação de sinais de vídeo no intuito de realizar-se a leitura labial. Nas tarefas de reconhecimento de padrões, a extração de características relevantes é crucial para um bom desempenho dos classificadores. O ponto de partida deste trabalho foi a reprodução do trabalho de J.R. Movellan [1], que realiza a classificação de gestos labiais com HMM na base de dados Tulips1, utilizando somente o sinal de vídeo. A base é composta por vídeos das bocas de voluntários enquanto esses pronunciam os primeiros 4 numerais em inglês. O trabalho original utiliza vetores de características de dimensão muito alta em relação ao tamanho da base. Consequentemente, o ajuste de classificadores HMM se tornou problemático e só se alcançou 66,67% de acurácia. Estratégias de extração de características e esquemas de classificação alternativos foram propostos, a fim de analisar a influência da dimensão intrínseca no desempenho de classificadores. A melhor solução, em termos de resultados, obteve uma acurácia de aproximadamente 83%. === São Cristóvão, SE
author2 Montalvão Filho, Jugurta Rosa
author_facet Montalvão Filho, Jugurta Rosa
Madureira, Fillipe Levi Guedes
author Madureira, Fillipe Levi Guedes
author_sort Madureira, Fillipe Levi Guedes
title Estudo dimensional de características aplicadas à leitura labial automática
title_short Estudo dimensional de características aplicadas à leitura labial automática
title_full Estudo dimensional de características aplicadas à leitura labial automática
title_fullStr Estudo dimensional de características aplicadas à leitura labial automática
title_full_unstemmed Estudo dimensional de características aplicadas à leitura labial automática
title_sort estudo dimensional de características aplicadas à leitura labial automática
publisher Pós-Graduação em Engenharia Elétrica
publishDate 2018
url http://ri.ufs.br/jspui/handle/riufs/9567
work_keys_str_mv AT madureirafillipeleviguedes estudodimensionaldecaracteristicasaplicadasaleituralabialautomatica
_version_ 1718868049884348416