Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication
Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spéc...
Main Author: | |
---|---|
Language: | English |
Published: |
Université Montpellier II - Sciences et Techniques du Languedoc
2009
|
Subjects: | |
Online Access: | http://tel.archives-ouvertes.fr/tel-00431117 http://tel.archives-ouvertes.fr/docs/00/43/11/17/PDF/manuscrit_li.pdf |
id |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00431117 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-004311172014-10-14T03:36:10Z http://tel.archives-ouvertes.fr/tel-00431117 http://tel.archives-ouvertes.fr/docs/00/43/11/17/PDF/manuscrit_li.pdf Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication Li, Haoyuan [INFO:INFO_HC] Computer Science/Human-Computer Interaction [INFO:INFO_HC] Informatique/Interface homme-machine Extraction de connaissances fouille de données base de données de séquences mesure d'intérêt système de croyances séquences inattendues motifs séquentiels règles séquentielles logique floue hiérarchie validation classification de textes Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons intra-transactions. Ce problème, posé à l'origine dans un contexte de marketing, intéresse à présent des domaines aussi variés que les télécommunications, la finance, ou encore la médecine et la bioinformatique. Même s'il existe aujourd'hui de très nombreuses approches efficaces pour extraire des motifs, ces derniers ne sont pas forcément adaptés aux besoins des applications réelles. En fait, les résultats obtenus sont basés sur une mesure statistique et ne tiennent pas compte de la connaissance du domaine. De plus, ces approches sont principalement axées sur la recherche de tendances et ne permettent pas d'extraire des connaissances sur les éléments atypiques ou inattendus. Dans le cadre de cette thèse, nous nous intéressons donc à la problématique de l'extraction de motifs séquentiels et règles inattendus en intégrant la connaissance du domaine. Le travail présenté dans cette thèse comporte la mise en œuvre d'un cadre MUSE pour l'extraction de séquences inattendues par rapport à un système de croyances, des extensions avec la théorie de logique floue, l'intégration des données hiérarchisées, la définition des motifs séquentiels et règles inattendus et, enfin, l'extraction de phrases inattendues dans des documents textes. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions. 2009-09-10 eng PhD thesis Université Montpellier II - Sciences et Techniques du Languedoc |
collection |
NDLTD |
language |
English |
sources |
NDLTD |
topic |
[INFO:INFO_HC] Computer Science/Human-Computer Interaction [INFO:INFO_HC] Informatique/Interface homme-machine Extraction de connaissances fouille de données base de données de séquences mesure d'intérêt système de croyances séquences inattendues motifs séquentiels règles séquentielles logique floue hiérarchie validation classification de textes |
spellingShingle |
[INFO:INFO_HC] Computer Science/Human-Computer Interaction [INFO:INFO_HC] Informatique/Interface homme-machine Extraction de connaissances fouille de données base de données de séquences mesure d'intérêt système de croyances séquences inattendues motifs séquentiels règles séquentielles logique floue hiérarchie validation classification de textes Li, Haoyuan Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
description |
Les motifs séquentiels peuvent être vus comme une extension de la notion d'itemsets fréquents intégrant diverses contraintes temporelles. La recherche de tels motifs consiste ainsi à extraire des enchaînements d'ensembles d'items, couramment associés sur une période de temps bien spécifiée. La construction de règles à partir de ces motifs séquentiels permet d'étendre la notion de règles d'association pour la pris en compte de la temporalité. En fait, cette recherche met en évidence des associations inter-transactions, contrairement à celle des règles d'association qui extrait des combinaisons intra-transactions. Ce problème, posé à l'origine dans un contexte de marketing, intéresse à présent des domaines aussi variés que les télécommunications, la finance, ou encore la médecine et la bioinformatique. Même s'il existe aujourd'hui de très nombreuses approches efficaces pour extraire des motifs, ces derniers ne sont pas forcément adaptés aux besoins des applications réelles. En fait, les résultats obtenus sont basés sur une mesure statistique et ne tiennent pas compte de la connaissance du domaine. De plus, ces approches sont principalement axées sur la recherche de tendances et ne permettent pas d'extraire des connaissances sur les éléments atypiques ou inattendus. Dans le cadre de cette thèse, nous nous intéressons donc à la problématique de l'extraction de motifs séquentiels et règles inattendus en intégrant la connaissance du domaine. Le travail présenté dans cette thèse comporte la mise en œuvre d'un cadre MUSE pour l'extraction de séquences inattendues par rapport à un système de croyances, des extensions avec la théorie de logique floue, l'intégration des données hiérarchisées, la définition des motifs séquentiels et règles inattendus et, enfin, l'extraction de phrases inattendues dans des documents textes. Des expérimentations menées sur des données synthétiques et sur des données réelles sont rapportées et montrent l'intérêt de nos propositions. |
author |
Li, Haoyuan |
author_facet |
Li, Haoyuan |
author_sort |
Li, Haoyuan |
title |
Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
title_short |
Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
title_full |
Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
title_fullStr |
Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
title_full_unstemmed |
Extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
title_sort |
extraction de séquences inattendues : des motifs séquentiels aux règles d'implication |
publisher |
Université Montpellier II - Sciences et Techniques du Languedoc |
publishDate |
2009 |
url |
http://tel.archives-ouvertes.fr/tel-00431117 http://tel.archives-ouvertes.fr/docs/00/43/11/17/PDF/manuscrit_li.pdf |
work_keys_str_mv |
AT lihaoyuan extractiondesequencesinattenduesdesmotifssequentielsauxreglesdimplication |
_version_ |
1716717197269663744 |