Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics
Dans cette thèse, nous avons proposé une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé fonctionne selon deux niveaux différents. Un module de filtrage global permettant de définir plusieurs zones candidates de la requête dans le document tes...
Main Author: | |
---|---|
Other Authors: | |
Language: | en |
Published: |
2016
|
Subjects: | |
Online Access: | http://www.theses.fr/2016LAROS008/document |
id |
ndltd-theses.fr-2016LAROS008 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-theses.fr-2016LAROS0082019-05-01T03:51:39Z Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics Filtres généralisés de Haar pour l’analyse de documents : application aux word spotting et extraction de texte dans les bandes dessinées Analyse des documents Word spotting Filtres de Haar Extraction de texte Documents manuscrits Bandes dessinées Perception humaine Document analysis Word spotting Haar-like filters Text extraction Manuscript documents Comics Human perception Dans cette thèse, nous avons proposé une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé fonctionne selon deux niveaux différents. Un module de filtrage global permettant de définir plusieurs zones candidates de la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau inférieur afin d’affiner les résultats et sélectionner uniquement ceux qui sont vraiment pertinents. Cette approche de word spotting est basée sur des familles généralisées de filtres de Haar qui s’adaptent à chaque requête pour procéder au processus de spotting et aussi sur un principe de vote qui permet de choisir l’emplacement spatial où les réponses générées par les filtres sont accumulées. Nous avons en plus proposé une autre approche pour l’extraction de texte du graphique dans les bandes dessinées. Cette approche se base essentiellement sur les caractéristiques pseudo-Haar qui sont générées par l’application des filtres généralisés de Haar sur l’image de bande dessinée. Cette approche est une approche analytique et ne nécessite aucun processus d’extraction ni des bulles ni d’autres composants. The presented thesis follows two directions. The first one disposes a technique for text and graphic separation in comics. The second one points out a learning free segmentation free word spotting framework based on the query-by-string problem for manuscript documents. The two approaches are based on human perception characteristics. Indeed, they were inspired by several characteristics of human vision such as the Preattentive processing. These characteristics guide us to introduce two multi scale approaches for two different document analysis tasks which are text extraction from comics and word spotting in manuscript document. These two approaches are based on applying generalized Haar-like filters globally on each document image whatever its type. Describing and detailing the use of such features throughout this thesis, we offer the researches of document image analysis field a new line of research that has to be more explored in future. The two approaches are layout segmentation free and the generalized Haar-like filters are applied globally on the image. Moreover, no binarization step of the processed document is done in order to avoid losing data that may influence the accuracy of the two frameworks. Indeed, any learning step is performed. Thus, we avoid the process of extraction features a priori which will be performed automatically, taking into consideration the different characteristics of the documents. Electronic Thesis or Dissertation Text en http://www.theses.fr/2016LAROS008/document Ghorbel, Adam 2016-07-18 La Rochelle Ogier, Jean-Marc Vincent, Nicole |
collection |
NDLTD |
language |
en |
sources |
NDLTD |
topic |
Analyse des documents Word spotting Filtres de Haar Extraction de texte Documents manuscrits Bandes dessinées Perception humaine Document analysis Word spotting Haar-like filters Text extraction Manuscript documents Comics Human perception |
spellingShingle |
Analyse des documents Word spotting Filtres de Haar Extraction de texte Documents manuscrits Bandes dessinées Perception humaine Document analysis Word spotting Haar-like filters Text extraction Manuscript documents Comics Human perception Ghorbel, Adam Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics |
description |
Dans cette thèse, nous avons proposé une approche analytique multi-échelle pour le word spotting dans les documents manuscrits. Le modèle proposé fonctionne selon deux niveaux différents. Un module de filtrage global permettant de définir plusieurs zones candidates de la requête dans le document testé. Ensuite, l’échelle de l’observation est modifiée à un niveau inférieur afin d’affiner les résultats et sélectionner uniquement ceux qui sont vraiment pertinents. Cette approche de word spotting est basée sur des familles généralisées de filtres de Haar qui s’adaptent à chaque requête pour procéder au processus de spotting et aussi sur un principe de vote qui permet de choisir l’emplacement spatial où les réponses générées par les filtres sont accumulées. Nous avons en plus proposé une autre approche pour l’extraction de texte du graphique dans les bandes dessinées. Cette approche se base essentiellement sur les caractéristiques pseudo-Haar qui sont générées par l’application des filtres généralisés de Haar sur l’image de bande dessinée. Cette approche est une approche analytique et ne nécessite aucun processus d’extraction ni des bulles ni d’autres composants. === The presented thesis follows two directions. The first one disposes a technique for text and graphic separation in comics. The second one points out a learning free segmentation free word spotting framework based on the query-by-string problem for manuscript documents. The two approaches are based on human perception characteristics. Indeed, they were inspired by several characteristics of human vision such as the Preattentive processing. These characteristics guide us to introduce two multi scale approaches for two different document analysis tasks which are text extraction from comics and word spotting in manuscript document. These two approaches are based on applying generalized Haar-like filters globally on each document image whatever its type. Describing and detailing the use of such features throughout this thesis, we offer the researches of document image analysis field a new line of research that has to be more explored in future. The two approaches are layout segmentation free and the generalized Haar-like filters are applied globally on the image. Moreover, no binarization step of the processed document is done in order to avoid losing data that may influence the accuracy of the two frameworks. Indeed, any learning step is performed. Thus, we avoid the process of extraction features a priori which will be performed automatically, taking into consideration the different characteristics of the documents. |
author2 |
La Rochelle |
author_facet |
La Rochelle Ghorbel, Adam |
author |
Ghorbel, Adam |
author_sort |
Ghorbel, Adam |
title |
Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics |
title_short |
Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics |
title_full |
Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics |
title_fullStr |
Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics |
title_full_unstemmed |
Generalized Haar-like filters for document analysis : application to word spotting and text extraction from comics |
title_sort |
generalized haar-like filters for document analysis : application to word spotting and text extraction from comics |
publishDate |
2016 |
url |
http://www.theses.fr/2016LAROS008/document |
work_keys_str_mv |
AT ghorbeladam generalizedhaarlikefiltersfordocumentanalysisapplicationtowordspottingandtextextractionfromcomics AT ghorbeladam filtresgeneralisesdehaarpourlanalysededocumentsapplicationauxwordspottingetextractiondetextedanslesbandesdessinees |
_version_ |
1719021399302995968 |