Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics

Dans cette thèse, nous avons proposé une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé fonctionne selon deux niveaux différents. Un module de filtrage global permettant de définir plusieurs zones candidates de la requête dans le document tes...

Full description

Bibliographic Details
Main Author: Ghorbel, Adam
Other Authors: La Rochelle
Language:en
Published: 2016
Subjects:
Online Access:http://www.theses.fr/2016LAROS008/document
id ndltd-theses.fr-2016LAROS008
record_format oai_dc
spelling ndltd-theses.fr-2016LAROS0082019-05-01T03:51:39Z Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics Filtres généralisés de Haar pour l’analyse de documents : application aux word spotting et extraction de texte dans les bandes dessinées Analyse des documents Word spotting Filtres de Haar Extraction de texte Documents manuscrits Bandes dessinées Perception humaine Document analysis Word spotting Haar-like filters Text extraction Manuscript documents Comics Human perception Dans cette thèse, nous avons proposé une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé fonctionne selon deux niveaux différents. Un module de filtrage global permettant de définir plusieurs zones candidates de la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau inférieur afin d’affiner les résultats et sélectionner uniquement ceux qui sont vraiment pertinents. Cette approche de word spotting est basée sur des familles généralisées de filtres de Haar qui s’adaptent à chaque requête pour procéder au processus de spotting et aussi sur un principe de vote qui permet de choisir l’emplacement spatial où les réponses générées par les filtres sont accumulées. Nous avons en plus proposé une autre approche pour l’extraction de texte du graphique dans les bandes dessinées. Cette approche se base essentiellement sur les caractéristiques pseudo-Haar qui sont générées par l’application des filtres généralisés de Haar sur l’image de bande dessinée. Cette approche est une approche analytique et ne nécessite aucun processus d’extraction ni des bulles ni d’autres composants. The presented thesis follows two directions. The first one disposes a technique for text and graphic separation in comics. The second one points out a learning free segmentation free word spotting framework based on the query-by-string problem for manuscript documents. The two approaches are based on human perception characteristics. Indeed, they were inspired by several characteristics of human vision such as the Preattentive processing. These characteristics guide us to introduce two multi scale approaches for two different document analysis tasks which are text extraction from comics and word spotting in manuscript document. These two approaches are based on applying generalized Haar-like filters globally on each document image whatever its type. Describing and detailing the use of such features throughout this thesis, we offer the researches of document image analysis field a new line of research that has to be more explored in future. The two approaches are layout segmentation free and the generalized Haar-like filters are applied globally on the image. Moreover, no binarization step of the processed document is done in order to avoid losing data that may influence the accuracy of the two frameworks. Indeed, any learning step is performed. Thus, we avoid the process of extraction features a priori which will be performed automatically, taking into consideration the different characteristics of the documents. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016LAROS008/document Ghorbel, Adam 2016-07-18 La Rochelle Ogier, Jean-Marc Vincent, Nicole
collection NDLTD
language en
sources NDLTD
topic Analyse des documents
Word spotting
Filtres de Haar
Extraction de texte
Documents manuscrits
Bandes dessinées
Perception humaine
Document analysis
Word spotting
Haar-like filters
Text extraction
Manuscript documents
Comics
Human perception

spellingShingle Analyse des documents
Word spotting
Filtres de Haar
Extraction de texte
Documents manuscrits
Bandes dessinées
Perception humaine
Document analysis
Word spotting
Haar-like filters
Text extraction
Manuscript documents
Comics
Human perception

Ghorbel, Adam
Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
description Dans cette thèse, nous avons proposé une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé fonctionne selon deux niveaux différents. Un module de filtrage global permettant de définir plusieurs zones candidates de la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau inférieur afin d’affiner les résultats et sélectionner uniquement ceux qui sont vraiment pertinents. Cette approche de word spotting est basée sur des familles généralisées de filtres de Haar qui s’adaptent à chaque requête pour procéder au processus de spotting et aussi sur un principe de vote qui permet de choisir l’emplacement spatial où les réponses générées par les filtres sont accumulées. Nous avons en plus proposé une autre approche pour l’extraction de texte du graphique dans les bandes dessinées. Cette approche se base essentiellement sur les caractéristiques pseudo-Haar qui sont générées par l’application des filtres généralisés de Haar sur l’image de bande dessinée. Cette approche est une approche analytique et ne nécessite aucun processus d’extraction ni des bulles ni d’autres composants. === The presented thesis follows two directions. The first one disposes a technique for text and graphic separation in comics. The second one points out a learning free segmentation free word spotting framework based on the query-by-string problem for manuscript documents. The two approaches are based on human perception characteristics. Indeed, they were inspired by several characteristics of human vision such as the Preattentive processing. These characteristics guide us to introduce two multi scale approaches for two different document analysis tasks which are text extraction from comics and word spotting in manuscript document. These two approaches are based on applying generalized Haar-like filters globally on each document image whatever its type. Describing and detailing the use of such features throughout this thesis, we offer the researches of document image analysis field a new line of research that has to be more explored in future. The two approaches are layout segmentation free and the generalized Haar-like filters are applied globally on the image. Moreover, no binarization step of the processed document is done in order to avoid losing data that may influence the accuracy of the two frameworks. Indeed, any learning step is performed. Thus, we avoid the process of extraction features a priori which will be performed automatically, taking into consideration the different characteristics of the documents.
author2 La Rochelle
author_facet La Rochelle
Ghorbel, Adam
author Ghorbel, Adam
author_sort Ghorbel, Adam
title Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
title_short Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
title_full Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
title_fullStr Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
title_full_unstemmed Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
title_sort generalized haar-like filters for document analysis : application to word spotting and text extraction from comics
publishDate 2016
url http://www.theses.fr/2016LAROS008/document
work_keys_str_mv AT ghorbeladam generalizedhaarlikefiltersfordocumentanalysisapplicationtowordspottingandtextextractionfromcomics
AT ghorbeladam filtresgeneralisesdehaarpourlanalysededocumentsapplicationauxwordspottingetextractiondetextedanslesbandesdessinees
_version_ 1719021399302995968