Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues

Dans le cadre de l’aide à l’analyse de dialogues, un corpus de dialogues peut être représenté par un ensemble de tableaux d’annotations encodant les différents énoncés des dialogues. Afin d’identifier des schémas dialogiques mis en oeuvre fréquemment, nous définissons une méthodologie en deux étapes...

Full description

Bibliographic Details
Main Author:	Ales, Zacharie
Other Authors:	Rouen, INSA
Language:	fr
Published:	2014
Subjects:	Extraction de régularités K-partitionnement Approche polyèdrale Combinatorial optimization Regularity extraction Data mining
Online Access:	http://www.theses.fr/2014ISAM0015/document

id	ndltd-theses.fr-2014ISAM0015
record_format	oai_dc
spelling	ndltd-theses.fr-2014ISAM00152017-07-01T04:41:46Z Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues Extraction and clustering for regularities identification : application to dialogues analysis Extraction de régularités K-partitionnement Approche polyèdrale Combinatorial optimization Regularity extraction Data mining Dans le cadre de l’aide à l’analyse de dialogues, un corpus de dialogues peut être représenté par un ensemble de tableaux d’annotations encodant les différents énoncés des dialogues. Afin d’identifier des schémas dialogiques mis en oeuvre fréquemment, nous définissons une méthodologie en deux étapes : extraction de motifs récurrents, puis partitionnement de ces motifs en classes homogènes constituant ces régularités. Deux méthodes sont développées afin de réaliser l’extraction de motifs récurrents : LPCADC et SABRE. La première est une adaptation d’un algorithme de programmation dynamique tandis que la seconde est issue d’une modélisation formelle du problème d’extraction d’alignements locaux dans un couple de tableaux d’annotations.Le partitionnement de motifs récurrents est réalisé par diverses heuristiques de la littérature ainsi que deux formulations originales du problème de K-partitionnement sous la forme de programmes linéaires en nombres entiers. Lors d’une étude polyèdrale, nous caractérisons des facettes d’un polyèdre associé à ces formulations (notamment les inégalités de 2-partitions, les inégalités 2-chorded cycles et les inégalités de clique généralisées). Ces résultats théoriques permettent la mise en place d’un algorithme de plans coupants résolvant efficacement le problème.Nous développons le logiciel d’aide à la décision VIESA, mettant en oeuvre ces différentes méthodes et permettant leur évaluation au cours de deux expérimentations réalisées par un expert psychologue. Des régularités correspondant à des stratégies dialogiques que des extractions manuelles n’avaient pas permis d’obtenir sont ainsi identifiées. In the context of dialogue analysis, a corpus of dialogues can be represented as a set of arrays of annotations encoding the dialogue utterances. In order to identify the frequently used dialogue schemes, we design a two-step methodology in which recurrent patterns are first extracted and then partitioned into homogenous classes constituting the regularities. Two methods are developed to extract recurrent patterns: LPCA-DC and SABRE. The former is an adaptation of a dynamic programming algorithm whereas the latter is obtained from a formal modeling of the extraction of local alignment problem in annotations arrays.The partitioning of recurrent patterns is realised using various heuristics from the literature as well as two original formulations of the K-partitioning problem in the form of mixed integer linear programs. Throughout a polyhedral study of a polyhedron associated to these formulations, facets are characterized (in particular: 2-chorded cycle inequalities, 2-partition inequalities and general clique inequalities). These theoretical results allow the establishment of an efficient cutting plane algorithm.We developed a decision support software called VIESA which implements these different methods and allows their evaluation during two experiments realised by a psychologist. Thus, regularities corresponding to dialogical strategies that previous manual extractions failed to identify are obtained. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2014ISAM0015/document Ales, Zacharie 2014-11-28 Rouen, INSA Vercouter, Laurent Gout, Christian
collection	NDLTD
language	fr
sources	NDLTD
topic	Extraction de régularités K-partitionnement Approche polyèdrale Combinatorial optimization Regularity extraction Data mining
spellingShingle	Extraction de régularités K-partitionnement Approche polyèdrale Combinatorial optimization Regularity extraction Data mining Ales, Zacharie Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
description	Dans le cadre de l’aide à l’analyse de dialogues, un corpus de dialogues peut être représenté par un ensemble de tableaux d’annotations encodant les différents énoncés des dialogues. Afin d’identifier des schémas dialogiques mis en oeuvre fréquemment, nous définissons une méthodologie en deux étapes : extraction de motifs récurrents, puis partitionnement de ces motifs en classes homogènes constituant ces régularités. Deux méthodes sont développées afin de réaliser l’extraction de motifs récurrents : LPCADC et SABRE. La première est une adaptation d’un algorithme de programmation dynamique tandis que la seconde est issue d’une modélisation formelle du problème d’extraction d’alignements locaux dans un couple de tableaux d’annotations.Le partitionnement de motifs récurrents est réalisé par diverses heuristiques de la littérature ainsi que deux formulations originales du problème de K-partitionnement sous la forme de programmes linéaires en nombres entiers. Lors d’une étude polyèdrale, nous caractérisons des facettes d’un polyèdre associé à ces formulations (notamment les inégalités de 2-partitions, les inégalités 2-chorded cycles et les inégalités de clique généralisées). Ces résultats théoriques permettent la mise en place d’un algorithme de plans coupants résolvant efficacement le problème.Nous développons le logiciel d’aide à la décision VIESA, mettant en oeuvre ces différentes méthodes et permettant leur évaluation au cours de deux expérimentations réalisées par un expert psychologue. Des régularités correspondant à des stratégies dialogiques que des extractions manuelles n’avaient pas permis d’obtenir sont ainsi identifiées. === In the context of dialogue analysis, a corpus of dialogues can be represented as a set of arrays of annotations encoding the dialogue utterances. In order to identify the frequently used dialogue schemes, we design a two-step methodology in which recurrent patterns are first extracted and then partitioned into homogenous classes constituting the regularities. Two methods are developed to extract recurrent patterns: LPCA-DC and SABRE. The former is an adaptation of a dynamic programming algorithm whereas the latter is obtained from a formal modeling of the extraction of local alignment problem in annotations arrays.The partitioning of recurrent patterns is realised using various heuristics from the literature as well as two original formulations of the K-partitioning problem in the form of mixed integer linear programs. Throughout a polyhedral study of a polyhedron associated to these formulations, facets are characterized (in particular: 2-chorded cycle inequalities, 2-partition inequalities and general clique inequalities). These theoretical results allow the establishment of an efficient cutting plane algorithm.We developed a decision support software called VIESA which implements these different methods and allows their evaluation during two experiments realised by a psychologist. Thus, regularities corresponding to dialogical strategies that previous manual extractions failed to identify are obtained.
author2	Rouen, INSA
author_facet	Rouen, INSA Ales, Zacharie
author	Ales, Zacharie
author_sort	Ales, Zacharie
title	Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
title_short	Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
title_full	Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
title_fullStr	Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
title_full_unstemmed	Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
title_sort	extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues
publishDate	2014
url	http://www.theses.fr/2014ISAM0015/document
work_keys_str_mv	AT aleszacharie extractionetpartitionnementpourlarecherchederegularitesapplicationalanalysededialogues AT aleszacharie extractionandclusteringforregularitiesidentificationapplicationtodialoguesanalysis
_version_	1718489028228022272

Extraction et partitionnement pour la recherche de régularités : application à l’analyse de dialogues

Similar Items