Summary: | Submitted by Maria Medeiros (maria.dilva1@ufcg.edu.br) on 2018-08-24T15:00:51Z
No. of bitstreams: 1
RAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdf: 2547994 bytes, checksum: e7533ebc755ba778f971329b75a40ff2 (MD5) === Made available in DSpace on 2018-08-24T15:00:51Z (GMT). No. of bitstreams: 1
RAISSA BEZERRA ROCHA - TESE (PPgEE) 2017.pdf: 2547994 bytes, checksum: e7533ebc755ba778f971329b75a40ff2 (MD5)
Previous issue date: 2017-03-20 === CNPq === A busca por novos modelos que representem a biofísica da fonação da voz é importante
em aplicações que incluem o processamento do sinal de voz por representar uma ferramenta no conhecimento de característica dos locutores. Esta tese de doutorado apresenta uma nova abordagem para a teoria fonte-filtro de geração de voz, mais precisamente sons sonoros, que realiza a modelagem da voz por meio de três subsistemas independentes: fonte de excitação, trato vocal e radiação dos lábios e narinas. Trata-se de um modelo em que a geração da voz é feita por meio de filtros lineares e invariantes ao deslocamento no tempo e que leva em consideração a física da fonação, a partir da característica cicloestacionária do sinal de voz, proveniente do comportamento de vibração das cordas vocais. É sugerido que a frequência de oscilação das cordas vocais é dada em função da massa e comprimento delas, e que seu valor é alterado principalmente pela tensão longitudinal aplicada a elas. No modelo proposto para geração da voz, o movimento vibratório das cordas vocais é modelado por meio de um de gerador de trem de impulsos cicloestacionário, controlado por um sinal de tensão obtido a partir da forma de onda do sinal de voz. É realizada toda a análise matemática que abrange o novo modelo para a excitação glotal, apresentando-se uma expressão matemática da densidade espectral de potência do sinal que excita a glote, bem como para o sinal de voz, cujos parâmetros podem ser ajustados para emular patologias na glote. Além disso, apresenta-se a análise no domínio da frequência do pulso glotal usado. Para analisar o desempenho do modelo proposto, testes com locução foram realizados e os resultados indicam que o modelo proposto se ajusta bem a geração da voz. === The search for new models that represent the biophysics of voice phonation is important
for applications that include voice signal processing because it represents a tool for getting to
know the characteristics of the speakers. This doctoral thesis presents a new proposal for the
source-filter theory of voice production, more precisely related to voiced sounds, that performs
the voice modelling using three independent subsystems: the excitation source, the vocal tract,
the lip and nostrils radiation system. It is a proposal for a model to generate voice using linear
and time-invariant systems, and takes into account the phonation physics and the cyclestationarity
characteristics of the voice signal, related to the vibrational behavior of the vocal cords.
The model suggests that the frequency oscillation of the vocal folds is a function of the mass and
length, but controlled by the longitudinal tension applied to them. In the proposed voice generation
model, the vibratory movement of the vocal cords is modeled by a cyclestationary train of
impulses, controlled by a tension signal obtained from the voice signal waveform. A mathematical
analysis encompassing the new model for glottal excitation is accomplished by presenting
a mathematical expression of the signal power spectral density which excites the glottis, as well
as the voice signal, whose parameters can be adjusted to emulate pathologies in the glottis. Moreover,
the analysis of the utilized glottal pulse in the frequency domain is presented. To analyze
the performance of the proposed model, tests with locutions were done and the results indicate
that the proposed model adjusts well to voice generation.
|