Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique

La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes exist...

Full description

Bibliographic Details
Main Author: Kane, Mouhamadou bamba
Other Authors: Normandie
Language:fr
Published: 2017
Subjects:
Online Access:http://www.theses.fr/2017NORMC223/document
id ndltd-theses.fr-2017NORMC223
record_format oai_dc
spelling ndltd-theses.fr-2017NORMC2232019-12-13T03:29:04Z Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique Extraction and selection of minimal emerging patterns : application to chemoinformatics Fouille de données Motifs émergents minimaux Classification à base de règles Sélection à base de prototypes Règles supervisées Toxicologie prédictive Pattern mining Minimal emerging patterns Rule-based classification Prototype-based selection Supervised rules Chemoinformatics Computational toxicology La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes existantes qui extraient généralement les motifs émergentsminimaux les plus supportés, au risque de passer à côté de motifs très intéressants maispeu supportés par les données. De plus, notre méthode prend en compte l’absence d’attributqui apporte une nouvelle connaissance intéressante.En considérant les règles associées aux motifs émergents avec un support élevé comme desrègles prototypes, on a montré expérimentalement que cet ensemble de règles possède unebonne confiance sur les objets couverts mais malheureusement ne couvre pas une bonne partiedes objets ; ce qui constitue un frein pour leur usage en classification. Nous proposons uneméthode de sélection à base de prototypes qui améliore la couverture de l’ensemble des règlesprototypes sans pour autant dégrader leur confiance. Au vu des résultats encourageants obtenus,nous appliquons cette méthode de sélection sur un jeu de données chimique ayant rapport àl’environnement aquatique : Aquatox. Cela permet ainsi aux chimistes, dans un contexte declassification, de mieux expliquer la classification des molécules, qui sans cette méthode desélection serait prédites par l’usage d’une règle par défaut. Pattern discovery is an important field of Knowledge Discovery in Databases.This work deals with the extraction of minimal emerging patterns. We propose a new efficientmethod which allows to extract the minimal emerging patterns with or without constraint ofsupport ; unlike existing methods that typically extract the most supported minimal emergentpatterns, at the risk of missing interesting but less supported patterns. Moreover, our methodtakes into account the absence of attribute that brings a new interesting knowledge.Considering the rules associated with emerging patterns highly supported as prototype rules,we have experimentally shown that this set of rules has good confidence on the covered objectsbut unfortunately does not cover a significant part of the objects ; which is a disavadntagefor their use in classification. We propose a prototype-based selection method that improvesthe coverage of the set of the prototype rules without a significative loss on their confidence.We apply our prototype-based selection method to a chemical data relating to the aquaticenvironment : Aquatox. In a classification context, it allows chemists to better explain theclassification of molecules, which, without this method of selection, would be predicted by theuse of a default rule. Electronic Thesis or Dissertation Text fr http://www.theses.fr/2017NORMC223/document Kane, Mouhamadou bamba 2017-09-06 Normandie Crémilleux, Bruno Lepailleur, Alban
collection NDLTD
language fr
sources NDLTD
topic Fouille de données
Motifs émergents minimaux
Classification à base de règles
Sélection à base de prototypes
Règles supervisées
Toxicologie prédictive
Pattern mining
Minimal emerging patterns
Rule-based classification
Prototype-based selection
Supervised rules
Chemoinformatics
Computational toxicology

spellingShingle Fouille de données
Motifs émergents minimaux
Classification à base de règles
Sélection à base de prototypes
Règles supervisées
Toxicologie prédictive
Pattern mining
Minimal emerging patterns
Rule-based classification
Prototype-based selection
Supervised rules
Chemoinformatics
Computational toxicology

Kane, Mouhamadou bamba
Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
description La découverte de motifs est une tâche importante en fouille de données. Cemémoire traite de l’extraction des motifs émergents minimaux. Nous proposons une nouvelleméthode efficace qui permet d’extraire les motifs émergents minimaux sans ou avec contraintede support ; contrairement aux méthodes existantes qui extraient généralement les motifs émergentsminimaux les plus supportés, au risque de passer à côté de motifs très intéressants maispeu supportés par les données. De plus, notre méthode prend en compte l’absence d’attributqui apporte une nouvelle connaissance intéressante.En considérant les règles associées aux motifs émergents avec un support élevé comme desrègles prototypes, on a montré expérimentalement que cet ensemble de règles possède unebonne confiance sur les objets couverts mais malheureusement ne couvre pas une bonne partiedes objets ; ce qui constitue un frein pour leur usage en classification. Nous proposons uneméthode de sélection à base de prototypes qui améliore la couverture de l’ensemble des règlesprototypes sans pour autant dégrader leur confiance. Au vu des résultats encourageants obtenus,nous appliquons cette méthode de sélection sur un jeu de données chimique ayant rapport àl’environnement aquatique : Aquatox. Cela permet ainsi aux chimistes, dans un contexte declassification, de mieux expliquer la classification des molécules, qui sans cette méthode desélection serait prédites par l’usage d’une règle par défaut. === Pattern discovery is an important field of Knowledge Discovery in Databases.This work deals with the extraction of minimal emerging patterns. We propose a new efficientmethod which allows to extract the minimal emerging patterns with or without constraint ofsupport ; unlike existing methods that typically extract the most supported minimal emergentpatterns, at the risk of missing interesting but less supported patterns. Moreover, our methodtakes into account the absence of attribute that brings a new interesting knowledge.Considering the rules associated with emerging patterns highly supported as prototype rules,we have experimentally shown that this set of rules has good confidence on the covered objectsbut unfortunately does not cover a significant part of the objects ; which is a disavadntagefor their use in classification. We propose a prototype-based selection method that improvesthe coverage of the set of the prototype rules without a significative loss on their confidence.We apply our prototype-based selection method to a chemical data relating to the aquaticenvironment : Aquatox. In a classification context, it allows chemists to better explain theclassification of molecules, which, without this method of selection, would be predicted by theuse of a default rule.
author2 Normandie
author_facet Normandie
Kane, Mouhamadou bamba
author Kane, Mouhamadou bamba
author_sort Kane, Mouhamadou bamba
title Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
title_short Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
title_full Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
title_fullStr Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
title_full_unstemmed Extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
title_sort extraction et sélection de motifs émergents minimaux : application à la chémoinformatique
publishDate 2017
url http://www.theses.fr/2017NORMC223/document
work_keys_str_mv AT kanemouhamadoubamba extractionetselectiondemotifsemergentsminimauxapplicationalachemoinformatique
AT kanemouhamadoubamba extractionandselectionofminimalemergingpatternsapplicationtochemoinformatics
_version_ 1719303118048460800