Masquage de pertes de paquets en voix sur IP

Les communications téléphoniques en voix sur IP souffrent de la perte de paquets causée par les problèmes d'acheminement dus aux nœuds du réseau. La perte d'un paquet de voix induit la perte d'un segment de signal de parole (généralement 10ms par paquet perdu). Face à la grande divers...

Full description

Bibliographic Details
Main Author: Koenig, Lionel
Format: Others
Published: 2011
Online Access:http://oatao.univ-toulouse.fr/7045/1/koenig.pdf
id ndltd-univ-toulouse.fr-oai-oatao.univ-toulouse.fr-7045
record_format oai_dc
spelling ndltd-univ-toulouse.fr-oai-oatao.univ-toulouse.fr-70452017-10-11T05:08:41Z Masquage de pertes de paquets en voix sur IP Koenig, Lionel Les communications téléphoniques en voix sur IP souffrent de la perte de paquets causée par les problèmes d'acheminement dus aux nœuds du réseau. La perte d'un paquet de voix induit la perte d'un segment de signal de parole (généralement 10ms par paquet perdu). Face à la grande diversité des codeurs de parole, nous nous sommes intéressés dans le cadre de cette thèse à proposer une méthode de masquage de pertes de paquets générique, indépendante du codeur de parole utilisé. Ainsi, le masquage de pertes de paquets est appliqué au niveau du signal de parole reconstruit, après décodage, s'affranchissant ainsi du codeur de parole. Le système proposé repose sur une modélisation classique de type « modèles de Markov cachés » afin de suivre l'évolution acoustique de la parole. À notre connaissance, une seule étude a proposé l'utilisation des modèles de Markov cachés dans ce cadre [4]. Toutefois, Rødbro a utilisé l'utilisation de deux modèles, l'un pour la parole voisée, l'autre pour les parties non voisées, posant ainsi le problème de la distinction voisée/non voisée. Dans notre approche, un seul modèle de Markov caché est mis en œuvre. Aux paramètres classiques (10 coefficients de prédiction linéaire dans le domaine cepstral (LPCC) et dérivées premières) nous avons adjoint un nouvel indicateur continu de voisement [1, 2]. La recherche du meilleur chemin avec observations manquantes conduit à une version modifiée de l'algorithme de Viterbi pour l'estimation de ces observations. Les différentes contributions (indice de voisement, décodage acoutico-phonétique et restitution du signal) de cette thèse sont évaluées [3] en terme de taux de sur et sous segmentation, taux de reconnaissance et distances entre l'observation attendue et l'observation estimée. Nous donnons une indication de la qualité de la parole au travers d'une mesure perceptuelle : le PESQ. 2011-01-28 PhD Thesis PeerReviewed application/pdf http://oatao.univ-toulouse.fr/7045/1/koenig.pdf info:eu-repo/semantics/doctoralThesis info:eu-repo/semantics/openAccess Koenig, Lionel. Masquage de pertes de paquets en voix sur IP. PhD, Institut National Polytechnique de Toulouse, 2011 http://ethesis.inp-toulouse.fr/archive/00001455/ http://oatao.univ-toulouse.fr/7045/
collection NDLTD
format Others
sources NDLTD
description Les communications téléphoniques en voix sur IP souffrent de la perte de paquets causée par les problèmes d'acheminement dus aux nœuds du réseau. La perte d'un paquet de voix induit la perte d'un segment de signal de parole (généralement 10ms par paquet perdu). Face à la grande diversité des codeurs de parole, nous nous sommes intéressés dans le cadre de cette thèse à proposer une méthode de masquage de pertes de paquets générique, indépendante du codeur de parole utilisé. Ainsi, le masquage de pertes de paquets est appliqué au niveau du signal de parole reconstruit, après décodage, s'affranchissant ainsi du codeur de parole. Le système proposé repose sur une modélisation classique de type « modèles de Markov cachés » afin de suivre l'évolution acoustique de la parole. À notre connaissance, une seule étude a proposé l'utilisation des modèles de Markov cachés dans ce cadre [4]. Toutefois, Rødbro a utilisé l'utilisation de deux modèles, l'un pour la parole voisée, l'autre pour les parties non voisées, posant ainsi le problème de la distinction voisée/non voisée. Dans notre approche, un seul modèle de Markov caché est mis en œuvre. Aux paramètres classiques (10 coefficients de prédiction linéaire dans le domaine cepstral (LPCC) et dérivées premières) nous avons adjoint un nouvel indicateur continu de voisement [1, 2]. La recherche du meilleur chemin avec observations manquantes conduit à une version modifiée de l'algorithme de Viterbi pour l'estimation de ces observations. Les différentes contributions (indice de voisement, décodage acoutico-phonétique et restitution du signal) de cette thèse sont évaluées [3] en terme de taux de sur et sous segmentation, taux de reconnaissance et distances entre l'observation attendue et l'observation estimée. Nous donnons une indication de la qualité de la parole au travers d'une mesure perceptuelle : le PESQ.
author Koenig, Lionel
spellingShingle Koenig, Lionel
Masquage de pertes de paquets en voix sur IP
author_facet Koenig, Lionel
author_sort Koenig, Lionel
title Masquage de pertes de paquets en voix sur IP
title_short Masquage de pertes de paquets en voix sur IP
title_full Masquage de pertes de paquets en voix sur IP
title_fullStr Masquage de pertes de paquets en voix sur IP
title_full_unstemmed Masquage de pertes de paquets en voix sur IP
title_sort masquage de pertes de paquets en voix sur ip
publishDate 2011
url http://oatao.univ-toulouse.fr/7045/1/koenig.pdf
work_keys_str_mv AT koeniglionel masquagedepertesdepaquetsenvoixsurip
_version_ 1718552935940489216