Prise en compte de critères acoustiques pour la synthèse de la parole

Cette thèse s'inscrit dans le domaine de la synthèse vocale à partir du texte et traite plus articulièrement de la synthèse par corpus (SPC). Cette approche basée sur la concaténation de segments acoustiques contenus dans de grandes bases de données s'est peu à peu instaurée comme un stand...

Full description

Bibliographic Details
Main Author: Rouibia, Soufiane
Language:FRE
Published: Université Rennes 1 2006
Subjects:
HMM
Online Access:http://tel.archives-ouvertes.fr/tel-00111952
http://tel.archives-ouvertes.fr/docs/00/11/19/52/PDF/These_Soufiane.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00111952
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-001119522013-01-07T18:52:05Z http://tel.archives-ouvertes.fr/tel-00111952 http://tel.archives-ouvertes.fr/docs/00/11/19/52/PDF/These_Soufiane.pdf Prise en compte de critères acoustiques pour la synthèse de la parole Rouibia, Soufiane [INFO:INFO_OH] Computer Science/Other Synthèse de la parole HMM Sélection des unités Critères acoustiques Cette thèse s'inscrit dans le domaine de la synthèse vocale à partir du texte et traite plus articulièrement de la synthèse par corpus (SPC). Cette approche basée sur la concaténation de segments acoustiques contenus dans de grandes bases de données s'est peu à peu instaurée comme un standard. En effet, moyennant la sélection d'unités adaptées au contexte de synthèse, elle permet d'aboutir à un signal de parole dont le naturel peut être assez bien préservé. La qualité de la synthèse obtenue par la méthode par concaténation est étroitement liée d'une part au corpus de synthèse et d'autre part à l'algorithme de sélection des unités. Malgré le saut notable de qualité qu'a permis d'atteindre cette technologie, la SPC n'est pas capable de garantir une parole dont la qualité soit à peu près constante sur l'ensemble d'un énoncé. Ceci est en grande partie dû au manque de contrôle acoustique des systèmes de SPC actuels. L'objectif de cette thèse est donc d'introduire des mécanismes permettant un meilleur contrôle acoustique lors de la synthèse.<br /> <br />La méthode proposée consiste à effectuer une sélection sur la base d'une cible purement acoustique. Cette cible est déduite de modèles acoustiques - plus précisément des modèles de sénones - estimés lors d'une phase d'apprentissage. Dans un premier temps, nous proposons un algorithme de sélection basé uniquement sur cette cible acoustique. Puis la méthode de sélection est modifiée de manière à mieux contrôler l'information de fréquence fondamentale. Le module de sélection proposé est également combiné à un module de pré-sélection des unités, ce qui conduit à une diminution sensible de la complexité algorithmique sans dégradation perceptible des résultats. Des tests d'écoutes formels révèlent que la méthode proposée permet de réduire significativement les discontinuités acoustiques lors de la concaténation. La méthode proposée est également appliquée à la réduction de corpus acoustiques et conduit à une réduction de l'ordre de 60% de la base acoustique sans dégradation de la qualité de la parole produite. 2006-09-27 FRE PhD thesis Université Rennes 1
collection NDLTD
language FRE
sources NDLTD
topic [INFO:INFO_OH] Computer Science/Other
Synthèse de la parole
HMM
Sélection des unités
Critères acoustiques
spellingShingle [INFO:INFO_OH] Computer Science/Other
Synthèse de la parole
HMM
Sélection des unités
Critères acoustiques
Rouibia, Soufiane
Prise en compte de critères acoustiques pour la synthèse de la parole
description Cette thèse s'inscrit dans le domaine de la synthèse vocale à partir du texte et traite plus articulièrement de la synthèse par corpus (SPC). Cette approche basée sur la concaténation de segments acoustiques contenus dans de grandes bases de données s'est peu à peu instaurée comme un standard. En effet, moyennant la sélection d'unités adaptées au contexte de synthèse, elle permet d'aboutir à un signal de parole dont le naturel peut être assez bien préservé. La qualité de la synthèse obtenue par la méthode par concaténation est étroitement liée d'une part au corpus de synthèse et d'autre part à l'algorithme de sélection des unités. Malgré le saut notable de qualité qu'a permis d'atteindre cette technologie, la SPC n'est pas capable de garantir une parole dont la qualité soit à peu près constante sur l'ensemble d'un énoncé. Ceci est en grande partie dû au manque de contrôle acoustique des systèmes de SPC actuels. L'objectif de cette thèse est donc d'introduire des mécanismes permettant un meilleur contrôle acoustique lors de la synthèse.<br /> <br />La méthode proposée consiste à effectuer une sélection sur la base d'une cible purement acoustique. Cette cible est déduite de modèles acoustiques - plus précisément des modèles de sénones - estimés lors d'une phase d'apprentissage. Dans un premier temps, nous proposons un algorithme de sélection basé uniquement sur cette cible acoustique. Puis la méthode de sélection est modifiée de manière à mieux contrôler l'information de fréquence fondamentale. Le module de sélection proposé est également combiné à un module de pré-sélection des unités, ce qui conduit à une diminution sensible de la complexité algorithmique sans dégradation perceptible des résultats. Des tests d'écoutes formels révèlent que la méthode proposée permet de réduire significativement les discontinuités acoustiques lors de la concaténation. La méthode proposée est également appliquée à la réduction de corpus acoustiques et conduit à une réduction de l'ordre de 60% de la base acoustique sans dégradation de la qualité de la parole produite.
author Rouibia, Soufiane
author_facet Rouibia, Soufiane
author_sort Rouibia, Soufiane
title Prise en compte de critères acoustiques pour la synthèse de la parole
title_short Prise en compte de critères acoustiques pour la synthèse de la parole
title_full Prise en compte de critères acoustiques pour la synthèse de la parole
title_fullStr Prise en compte de critères acoustiques pour la synthèse de la parole
title_full_unstemmed Prise en compte de critères acoustiques pour la synthèse de la parole
title_sort prise en compte de critères acoustiques pour la synthèse de la parole
publisher Université Rennes 1
publishDate 2006
url http://tel.archives-ouvertes.fr/tel-00111952
http://tel.archives-ouvertes.fr/docs/00/11/19/52/PDF/These_Soufiane.pdf
work_keys_str_mv AT rouibiasoufiane priseencomptedecriteresacoustiquespourlasynthesedelaparole
_version_ 1716454849693876224