Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes exist...
Main Author: | |
---|---|
Other Authors: | |
Language: | fr |
Published: |
2017
|
Subjects: | |
Online Access: | http://www.theses.fr/2017NORMC223/document |
id |
ndltd-theses.fr-2017NORMC223 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-theses.fr-2017NORMC2232019-12-13T03:29:04Z Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique Extraction and selection of minimal emerging patterns : application to chemoinformatics Fouille de données Motifs émergents minimaux Classification à base de règles Sélection à base de prototypes Règles supervisées Toxicologie prédictive Pattern mining Minimal emerging patterns Rule-based classification Prototype-based selection Supervised rules Chemoinformatics Computational toxicology La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes existantes qui extraient généralement les motifs émergentsminimaux les plus supportés, au risque de passer à côté de motifs très intéressants maispeu supportés par les données. De plus, notre méthode prend en compte l’absence d’attributqui apporte une nouvelle connaissance intéressante.En considérant les règles associées aux motifs émergents avec un support élevé comme desrègles prototypes, on a montré expérimentalement que cet ensemble de règles possède unebonne confiance sur les objets couverts mais malheureusement ne couvre pas une bonne partiedes objets ; ce qui constitue un frein pour leur usage en classification. Nous proposons uneméthode de sélection à base de prototypes qui améliore la couverture de l’ensemble des règlesprototypes sans pour autant dégrader leur confiance. Au vu des résultats encourageants obtenus,nous appliquons cette méthode de sélection sur un jeu de données chimique ayant rapport àl’environnement aquatique : Aquatox. Cela permet ainsi aux chimistes, dans un contexte declassification, de mieux expliquer la classification des molécules, qui sans cette méthode desélection serait prédites par l’usage d’une règle par défaut. Pattern discovery is an important field of Knowledge Discovery in Databases.This work deals with the extraction of minimal emerging patterns. We propose a new efficientmethod which allows to extract the minimal emerging patterns with or without constraint ofsupport ; unlike existing methods that typically extract the most supported minimal emergentpatterns, at the risk of missing interesting but less supported patterns. Moreover, our methodtakes into account the absence of attribute that brings a new interesting knowledge.Considering the rules associated with emerging patterns highly supported as prototype rules,we have experimentally shown that this set of rules has good confidence on the covered objectsbut unfortunately does not cover a significant part of the objects ; which is a disavadntagefor their use in classification. We propose a prototype-based selection method that improvesthe coverage of the set of the prototype rules without a significative loss on their confidence.We apply our prototype-based selection method to a chemical data relating to the aquaticenvironment : Aquatox. In a classification context, it allows chemists to better explain theclassification of molecules, which, without this method of selection, would be predicted by theuse of a default rule. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2017NORMC223/document Kane, Mouhamadou bamba 2017-09-06 Normandie Crémilleux, Bruno Lepailleur, Alban |
collection |
NDLTD |
language |
fr |
sources |
NDLTD |
topic |
Fouille de données Motifs émergents minimaux Classification à base de règles Sélection à base de prototypes Règles supervisées Toxicologie prédictive Pattern mining Minimal emerging patterns Rule-based classification Prototype-based selection Supervised rules Chemoinformatics Computational toxicology |
spellingShingle |
Fouille de données Motifs émergents minimaux Classification à base de règles Sélection à base de prototypes Règles supervisées Toxicologie prédictive Pattern mining Minimal emerging patterns Rule-based classification Prototype-based selection Supervised rules Chemoinformatics Computational toxicology Kane, Mouhamadou bamba Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
description |
La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes existantes qui extraient généralement les motifs émergentsminimaux les plus supportés, au risque de passer à côté de motifs très intéressants maispeu supportés par les données. De plus, notre méthode prend en compte l’absence d’attributqui apporte une nouvelle connaissance intéressante.En considérant les règles associées aux motifs émergents avec un support élevé comme desrègles prototypes, on a montré expérimentalement que cet ensemble de règles possède unebonne confiance sur les objets couverts mais malheureusement ne couvre pas une bonne partiedes objets ; ce qui constitue un frein pour leur usage en classification. Nous proposons uneméthode de sélection à base de prototypes qui améliore la couverture de l’ensemble des règlesprototypes sans pour autant dégrader leur confiance. Au vu des résultats encourageants obtenus,nous appliquons cette méthode de sélection sur un jeu de données chimique ayant rapport àl’environnement aquatique : Aquatox. Cela permet ainsi aux chimistes, dans un contexte declassification, de mieux expliquer la classification des molécules, qui sans cette méthode desélection serait prédites par l’usage d’une règle par défaut. === Pattern discovery is an important field of Knowledge Discovery in Databases.This work deals with the extraction of minimal emerging patterns. We propose a new efficientmethod which allows to extract the minimal emerging patterns with or without constraint ofsupport ; unlike existing methods that typically extract the most supported minimal emergentpatterns, at the risk of missing interesting but less supported patterns. Moreover, our methodtakes into account the absence of attribute that brings a new interesting knowledge.Considering the rules associated with emerging patterns highly supported as prototype rules,we have experimentally shown that this set of rules has good confidence on the covered objectsbut unfortunately does not cover a significant part of the objects ; which is a disavadntagefor their use in classification. We propose a prototype-based selection method that improvesthe coverage of the set of the prototype rules without a significative loss on their confidence.We apply our prototype-based selection method to a chemical data relating to the aquaticenvironment : Aquatox. In a classification context, it allows chemists to better explain theclassification of molecules, which, without this method of selection, would be predicted by theuse of a default rule. |
author2 |
Normandie |
author_facet |
Normandie Kane, Mouhamadou bamba |
author |
Kane, Mouhamadou bamba |
author_sort |
Kane, Mouhamadou bamba |
title |
Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
title_short |
Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
title_full |
Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
title_fullStr |
Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
title_full_unstemmed |
Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
title_sort |
extraction et sélection de motifs émergents minimaux : application à la chémoinformatique |
publishDate |
2017 |
url |
http://www.theses.fr/2017NORMC223/document |
work_keys_str_mv |
AT kanemouhamadoubamba extractionetselectiondemotifsemergentsminimauxapplicationalachemoinformatique AT kanemouhamadoubamba extractionandselectionofminimalemergingpatternsapplicationtochemoinformatics |
_version_ |
1719303118048460800 |