Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication

Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spéc...

Full description

Bibliographic Details
Main Author: Li, Haoyuan
Language:English
Published: Université Montpellier II - Sciences et Techniques du Languedoc 2009
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00431117
http://tel.archives-ouvertes.fr/docs/00/43/11/17/PDF/manuscrit_li.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00431117
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-004311172014-10-14T03:36:10Z http://tel.archives-ouvertes.fr/tel-00431117 http://tel.archives-ouvertes.fr/docs/00/43/11/17/PDF/manuscrit_li.pdf Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication Li, Haoyuan [INFO:INFO_HC] Computer Science/Human-Computer Interaction [INFO:INFO_HC] Informatique/Interface homme-machine Extraction de connaissances fouille de données base de données de séquences mesure d'intérêt système de croyances séquences inattendues motifs séquentiels règles séquentielles logique floue hiérarchie validation classification de textes Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons intra-transactions. Ce problème, posé à l'origine dans un contexte de marketing, intéresse à présent des domaines aussi variés que les télécommunications, la finance, ou encore la médecine et la bioinformatique. Même s'il existe aujourd'hui de très nombreuses approches efficaces pour extraire des motifs, ces derniers ne sont pas forcément adaptés aux besoins des applications réelles. En fait, les résultats obtenus sont basés sur une mesure statistique et ne tiennent pas compte de la connaissance du domaine. De plus, ces approches sont principalement axées sur la recherche de tendances et ne permettent pas d'extraire des connaissances sur les éléments atypiques ou inattendus. Dans le cadre de cette thèse, nous nous intéressons donc à la problématique de l'extraction de motifs séquentiels et règles inattendus en intégrant la connaissance du domaine. Le travail présenté dans cette thèse comporte la mise en œuvre d'un cadre MUSE pour l'extraction de séquences inattendues par rapport à un système de croyances, des extensions avec la théorie de logique floue, l'intégration des données hiérarchisées, la définition des motifs séquentiels et règles inattendus et, enfin, l'extraction de phrases inattendues dans des documents textes. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions. 2009-09-10 eng PhD thesis Université Montpellier II - Sciences et Techniques du Languedoc
collection NDLTD
language English
sources NDLTD
topic [INFO:INFO_HC] Computer Science/Human-Computer Interaction
[INFO:INFO_HC] Informatique/Interface homme-machine
Extraction de connaissances
fouille de données
base de données de séquences
mesure d'intérêt
système de croyances
séquences inattendues
motifs séquentiels
règles séquentielles
logique floue
hiérarchie
validation
classification de textes
spellingShingle [INFO:INFO_HC] Computer Science/Human-Computer Interaction
[INFO:INFO_HC] Informatique/Interface homme-machine
Extraction de connaissances
fouille de données
base de données de séquences
mesure d'intérêt
système de croyances
séquences inattendues
motifs séquentiels
règles séquentielles
logique floue
hiérarchie
validation
classification de textes
Li, Haoyuan
Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
description Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons intra-transactions. Ce problème, posé à l'origine dans un contexte de marketing, intéresse à présent des domaines aussi variés que les télécommunications, la finance, ou encore la médecine et la bioinformatique. Même s'il existe aujourd'hui de très nombreuses approches efficaces pour extraire des motifs, ces derniers ne sont pas forcément adaptés aux besoins des applications réelles. En fait, les résultats obtenus sont basés sur une mesure statistique et ne tiennent pas compte de la connaissance du domaine. De plus, ces approches sont principalement axées sur la recherche de tendances et ne permettent pas d'extraire des connaissances sur les éléments atypiques ou inattendus. Dans le cadre de cette thèse, nous nous intéressons donc à la problématique de l'extraction de motifs séquentiels et règles inattendus en intégrant la connaissance du domaine. Le travail présenté dans cette thèse comporte la mise en œuvre d'un cadre MUSE pour l'extraction de séquences inattendues par rapport à un système de croyances, des extensions avec la théorie de logique floue, l'intégration des données hiérarchisées, la définition des motifs séquentiels et règles inattendus et, enfin, l'extraction de phrases inattendues dans des documents textes. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions.
author Li, Haoyuan
author_facet Li, Haoyuan
author_sort Li, Haoyuan
title Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
title_short Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
title_full Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
title_fullStr Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
title_full_unstemmed Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
title_sort extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
publisher Université Montpellier II - Sciences et Techniques du Languedoc
publishDate 2009
url http://tel.archives-ouvertes.fr/tel-00431117
http://tel.archives-ouvertes.fr/docs/00/43/11/17/PDF/manuscrit_li.pdf
work_keys_str_mv AT lihaoyuan extractiondesequencesinattenduesdesmotifssequentielsauxreglesdimplication
_version_ 1716717197269663744