Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole

Les technologies de reconnaissance automatique de la parole sont désormais intégrées dans de nombreux systèmes. La performance des systèmes de reconnaissance vocale pour les locuteurs non natifs continue cependant à souffrir de taux d'erreur élevés, en raison de la différence entre la parole no...

Full description

Bibliographic Details
Main Author:	Sam, Sethserey
Language:	fra
Published:	Université de Grenoble 2011
Subjects:	[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Traitement automatique de la parole non native Adaptation autonome de modèles acoustiques multilingues Observateur de langues Classification de la par Interpolation
Online Access:	http://tel.archives-ouvertes.fr/tel-00685204 http://tel.archives-ouvertes.fr/docs/00/68/52/04/PDF/20337_SAM_2011_archivage_1_.pdf

id	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00685204
record_format	oai_dc
spelling	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-006852042014-10-14T03:52:38Z http://tel.archives-ouvertes.fr/tel-00685204 2011GRENM017 http://tel.archives-ouvertes.fr/docs/00/68/52/04/PDF/20337_SAM_2011_archivage_1_.pdf Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole Sam, Sethserey [INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Traitement automatique de la parole non native Adaptation autonome de modèles acoustiques multilingues Observateur de langues Classification de la par Interpolation Les technologies de reconnaissance automatique de la parole sont désormais intégrées dans de nombreux systèmes. La performance des systèmes de reconnaissance vocale pour les locuteurs non natifs continue cependant à souffrir de taux d'erreur élevés, en raison de la différence entre la parole non native et les modèles entraînés. La réalisation d'enregistrements en grande quantité de parole non native est généralement une tâche très difficile et peu réaliste pour représenter toutes les origines des locuteurs. Ce travail de thèse porte sur l'amélioration des modèles acoustiques multilingues pour la transcription phonétique de la parole de type " réunion multilingue ". Traiter ce type de parole constitue plusieurs défis : 1) il peut exister de la conversation entre des locuteurs natifs et non natifs ; 2) il y a non seulement de la parole non native d'une langue, mais de plusieurs langues parlées par des locuteurs venant de différentes origines ; 3) il est difficile de collecter suffisamment de données pour amorcer les systèmes de transcription. Pour répondre à ces défis, nous proposons un processus d'adaptation de modèles acoustiques multilingues que nous appelons " adaptation autonome ". Dans l'adaptation autonome, nous étudions plusieurs approches pour adapter les modèles acoustiques multilingues de manière non supervisée (les langues parlées et les origines des locuteurs ne sont pas connues à l'avance) et qui n'utilise aucune donnée supplémentaire lors du processus d'adaptation. Les approches étudiées sont décomposées selon deux modules. Le premier module qui s'appelle " l'observateur de langues " consiste à récupérer les caractéristiques linguistiques (les langues parlées et les origines des locuteurs) des segments à décoder. Le deuxième module consiste à adapter le modèle acoustique multilingue en fonction des connaissances fournies par l'observateur de langue. Pour évaluer l'utilité de l'adaptation autonome d'un modèle acoustique multilingue, nous utilisons les données de test, qui sont extraites de réunions multilingues, contenant de la parole native et non native de trois langues : l'anglais (EN), le français (FR) et le vietnamien (VN). Selon les résultats d'expérimentation, l'adaptation autonome donne des résultats prometteurs pour les paroles non natives mais dégradent très légèrement les performances sur de la parole native. Afin d'améliorer la performance globale des systèmes de transcription pour toutes les paroles natives et non natives, nous étudions plusieurs approches de détection de parole non native et proposons de cascader un tel détecteur avec notre processus d'adaptation autonome. Les résultats obtenus ainsi, sont les meilleurs parmi toutes les expériences réalisées sur notre corpus de réunions multilingues. 2011-06-07 fra PhD thesis Université de Grenoble
collection	NDLTD
language	fra
sources	NDLTD
topic	[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Traitement automatique de la parole non native Adaptation autonome de modèles acoustiques multilingues Observateur de langues Classification de la par Interpolation
spellingShingle	[INFO:INFO_OH] Computer Science/Other [INFO:INFO_OH] Informatique/Autre Traitement automatique de la parole non native Adaptation autonome de modèles acoustiques multilingues Observateur de langues Classification de la par Interpolation Sam, Sethserey Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
description	Les technologies de reconnaissance automatique de la parole sont désormais intégrées dans de nombreux systèmes. La performance des systèmes de reconnaissance vocale pour les locuteurs non natifs continue cependant à souffrir de taux d'erreur élevés, en raison de la différence entre la parole non native et les modèles entraînés. La réalisation d'enregistrements en grande quantité de parole non native est généralement une tâche très difficile et peu réaliste pour représenter toutes les origines des locuteurs. Ce travail de thèse porte sur l'amélioration des modèles acoustiques multilingues pour la transcription phonétique de la parole de type " réunion multilingue ". Traiter ce type de parole constitue plusieurs défis : 1) il peut exister de la conversation entre des locuteurs natifs et non natifs ; 2) il y a non seulement de la parole non native d'une langue, mais de plusieurs langues parlées par des locuteurs venant de différentes origines ; 3) il est difficile de collecter suffisamment de données pour amorcer les systèmes de transcription. Pour répondre à ces défis, nous proposons un processus d'adaptation de modèles acoustiques multilingues que nous appelons " adaptation autonome ". Dans l'adaptation autonome, nous étudions plusieurs approches pour adapter les modèles acoustiques multilingues de manière non supervisée (les langues parlées et les origines des locuteurs ne sont pas connues à l'avance) et qui n'utilise aucune donnée supplémentaire lors du processus d'adaptation. Les approches étudiées sont décomposées selon deux modules. Le premier module qui s'appelle " l'observateur de langues " consiste à récupérer les caractéristiques linguistiques (les langues parlées et les origines des locuteurs) des segments à décoder. Le deuxième module consiste à adapter le modèle acoustique multilingue en fonction des connaissances fournies par l'observateur de langue. Pour évaluer l'utilité de l'adaptation autonome d'un modèle acoustique multilingue, nous utilisons les données de test, qui sont extraites de réunions multilingues, contenant de la parole native et non native de trois langues : l'anglais (EN), le français (FR) et le vietnamien (VN). Selon les résultats d'expérimentation, l'adaptation autonome donne des résultats prometteurs pour les paroles non natives mais dégradent très légèrement les performances sur de la parole native. Afin d'améliorer la performance globale des systèmes de transcription pour toutes les paroles natives et non natives, nous étudions plusieurs approches de détection de parole non native et proposons de cascader un tel détecteur avec notre processus d'adaptation autonome. Les résultats obtenus ainsi, sont les meilleurs parmi toutes les expériences réalisées sur notre corpus de réunions multilingues.
author	Sam, Sethserey
author_facet	Sam, Sethserey
author_sort	Sam, Sethserey
title	Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
title_short	Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
title_full	Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
title_fullStr	Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
title_full_unstemmed	Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
title_sort	vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole
publisher	Université de Grenoble
publishDate	2011
url	http://tel.archives-ouvertes.fr/tel-00685204 http://tel.archives-ouvertes.fr/docs/00/68/52/04/PDF/20337_SAM_2011_archivage_1_.pdf
work_keys_str_mv	AT samsethserey versuneadaptationautonomedesmodelesacoustiquesmultilinguespourletraitementautomatiquedelaparole
_version_	1716718281199452160

Vers une adaptation autonome des modèles acoustiques multilingues pour le traitement automatique de la parole

Similar Items