Summary: | Un algorithme de détection d'activité vocale (VAD) est un algorithme capable de discriminer entre les régions où la parole est absente dans le signal vocal analysé.
Le VAD est un module important utilisé dans une large gamme d'applications dans le domaine du traitement de la parole comme la reconnaissance, la transmission ou le rehaussement de la parole.
La nature non-stationnaire ainsi que la grande variété de signaux vocaux et de bruits de fond dans les conditions où on n'a pas d'informations a priori sur la nature ou le niveau du bruit rendent ce problème difficile spécialement dans le cas d'un faible rapport signal bruit RSB.
Bien que le problème de détection d'activité vocale ait été étudié depuis plusieurs décennies, une solution optimale ne s'est pas encore imposée. De nombreux algorithmes qui utilisent une large gamme de paramètres, certains d'entre-eux présentés dans cet ouvrage, ont été proposés pour répondre aux problèmes pratiques rencontrés.
Dans cet ouvrage on a implémenté sur le processeur numérique de signal TMS320C7611 un nouvel algorithme robuste de VAD qui utilise le concept d'analyse court-terme. La décision pour chaque trame de signal est fournie en temps-réel. Les distorsions spectrales, par rapport au spectre du bruit de fond, sont assimilées à des régions de parole et sont évaluées à l'aide de deux paramètres: le coefficient de corrélation spectrale et la moyenne de RSB de sous-bandes. Le filtrage médian et une approche statistique originale sont utilisés pour la détection robuste des régions de parole.
Pour évaluer les performances de l'algorithme proposé, on a utilisé un signal vocal de test complexe qui présente plusieurs régions de parole et de silence, corrompu avec plusieurs types de bruits réels dans le cas de trois RSB différentes. Les résultats de tests montrent le comportement robuste de l'algorithme proposé.
|