Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées

Les jeux de données décrivant des objets par des propriétés Booléennes sont des relations binaires, c'est à dire des matrices 0/1. Dans une telle relation, un ensemble fermé est un sous-ensemble maximal d'objets partageant le même sous-ensemble maximal de propriétés. L'extraction de c...

Full description

Bibliographic Details
Main Author: Cerf, Loïc
Language:ENG
Published: INSA de Lyon 2010
Subjects:
Online Access:http://tel.archives-ouvertes.fr/tel-00508534
http://tel.archives-ouvertes.fr/docs/00/57/86/80/PDF/PhD_thesis_Loic_Cerf_.pdf
http://tel.archives-ouvertes.fr/docs/00/57/86/80/ANNEX/PhD_thesis_Loic_Cerf_.pdf
id ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00508534
record_format oai_dc
spelling ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-005085342013-01-07T17:44:23Z http://tel.archives-ouvertes.fr/tel-00508534 http://tel.archives-ouvertes.fr/docs/00/57/86/80/PDF/PhD_thesis_Loic_Cerf_.pdf http://tel.archives-ouvertes.fr/docs/00/57/86/80/ANNEX/PhD_thesis_Loic_Cerf_.pdf Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées Cerf, Loïc [INFO:INFO_OH] Computer Science/Other Algorithme fouille de données motif relation n-aire contrainte tolérance au bruit graphe dynamique Les jeux de données décrivant des objets par des propriétés Booléennes sont des relations binaires, c'est à dire des matrices 0/1. Dans une telle relation, un ensemble fermé est un sous-ensemble maximal d'objets partageant le même sous-ensemble maximal de propriétés. L'extraction de ces motifs, satisfaisant des contraintes de pertinences définies par l'utilisateur, a été étudiée en profondeur. Néanmoins, beaucoup de jeux de données sont des relations n-aires, c'est à dire des tenseurs 0/1. Réduire leur analyse à deux dimensions revient à en ignorer d'autres qui sont potentiellement intéressantes. Par ailleurs, la présence de bruit dans les jeux de données réelles conduit à la fragmentation des motifs à découvrir. On généralise facilement la définition d'un ensemble fermé aux relations de plus grande arité et à la tolérance au bruit. Au contraire, généraliser leur extraction est très difficile. Notre extracteur parcourt l'espace des motifs candidats d'une façon originale qui ne favorise aucune dimension. Cette recherche peut être guidée par une très grande classe de contraintes de pertinence que les motifs doivent satisfaire. En particulier, cette thèse étudie des contraintes spécifiques à la fouille de graphes dynamiques. Notre extracteur est plusieurs ordres de grandeurs plus efficace que les algorithmes existants, pourtant plus restreints dans leurs applications. Malgré ces résultats, une approche exhaustive ne peut souvent pas, en un temps raisonnable, lister des motifs tolérants beaucoup de bruit. Dans ce cas, compléter l'extraction avec une agglomération hiérarchique des motifs permet d'arriver à ses fins. 2010-07-09 ENG PhD thesis INSA de Lyon
collection NDLTD
language ENG
sources NDLTD
topic [INFO:INFO_OH] Computer Science/Other
Algorithme
fouille de données
motif
relation n-aire
contrainte
tolérance au bruit
graphe dynamique
spellingShingle [INFO:INFO_OH] Computer Science/Other
Algorithme
fouille de données
motif
relation n-aire
contrainte
tolérance au bruit
graphe dynamique
Cerf, Loïc
Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées
description Les jeux de données décrivant des objets par des propriétés Booléennes sont des relations binaires, c'est à dire des matrices 0/1. Dans une telle relation, un ensemble fermé est un sous-ensemble maximal d'objets partageant le même sous-ensemble maximal de propriétés. L'extraction de ces motifs, satisfaisant des contraintes de pertinences définies par l'utilisateur, a été étudiée en profondeur. Néanmoins, beaucoup de jeux de données sont des relations n-aires, c'est à dire des tenseurs 0/1. Réduire leur analyse à deux dimensions revient à en ignorer d'autres qui sont potentiellement intéressantes. Par ailleurs, la présence de bruit dans les jeux de données réelles conduit à la fragmentation des motifs à découvrir. On généralise facilement la définition d'un ensemble fermé aux relations de plus grande arité et à la tolérance au bruit. Au contraire, généraliser leur extraction est très difficile. Notre extracteur parcourt l'espace des motifs candidats d'une façon originale qui ne favorise aucune dimension. Cette recherche peut être guidée par une très grande classe de contraintes de pertinence que les motifs doivent satisfaire. En particulier, cette thèse étudie des contraintes spécifiques à la fouille de graphes dynamiques. Notre extracteur est plusieurs ordres de grandeurs plus efficace que les algorithmes existants, pourtant plus restreints dans leurs applications. Malgré ces résultats, une approche exhaustive ne peut souvent pas, en un temps raisonnable, lister des motifs tolérants beaucoup de bruit. Dans ce cas, compléter l'extraction avec une agglomération hiérarchique des motifs permet d'arriver à ses fins.
author Cerf, Loïc
author_facet Cerf, Loïc
author_sort Cerf, Loïc
title Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées
title_short Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées
title_full Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées
title_fullStr Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées
title_full_unstemmed Fouille Sous Contraintes de Motifs Fermés dans des Relations n-aires Bruitées
title_sort fouille sous contraintes de motifs fermés dans des relations n-aires bruitées
publisher INSA de Lyon
publishDate 2010
url http://tel.archives-ouvertes.fr/tel-00508534
http://tel.archives-ouvertes.fr/docs/00/57/86/80/PDF/PhD_thesis_Loic_Cerf_.pdf
http://tel.archives-ouvertes.fr/docs/00/57/86/80/ANNEX/PhD_thesis_Loic_Cerf_.pdf
work_keys_str_mv AT cerfloic fouillesouscontraintesdemotifsfermesdansdesrelationsnairesbruitees
_version_ 1716396552674607104