Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern

Am Institut für Print- und Medientechnik an der TU Chemnitz wird ein System entwickelt, welches gescannte Dokumente archivieren soll. Im Gegensatz zu bereits existierenden OCR-Systemen, sollen diese Dokumente hier jedoch nicht mittels einer Schrifterkennung verarbeitet werden. Vielmehr sind Textbere...

Full description

Bibliographic Details
Main Author: Poller, Andreas
Other Authors: Technische Universität Chemnitz
Language:German
Published: 2005
Subjects:
Online Access:http://nbn-resolving.de/urn:nbn:de:swb:ch1-200501550
https://monarch.qucosa.de/id/qucosa%3A18403
https://monarch.qucosa.de/api/qucosa%3A18403/attachment/ATT-0/
https://monarch.qucosa.de/api/qucosa%3A18403/attachment/ATT-1/
id ndltd-DRESDEN-oai-qucosa-de-qucosa-18403
record_format oai_dc
spelling ndltd-DRESDEN-oai-qucosa-de-qucosa-184032021-03-30T05:05:52Z Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern urn:nbn:de:swb:ch1-200501550 ger Am Institut für Print- und Medientechnik an der TU Chemnitz wird ein System entwickelt, welches gescannte Dokumente archivieren soll. Im Gegensatz zu bereits existierenden OCR-Systemen, sollen diese Dokumente hier jedoch nicht mittels einer Schrifterkennung verarbeitet werden. Vielmehr sind Textbereiche in den gescannten Vorlagen zu vektorisieren. Bereiche mit Grafiken und Illustrationen werden bei diesem Verfahren als ein Bildvektor gespeichert. Diese Vorgehensweise soll es ermöglichen, auch Dokumente mit Schriftsymbolen effizient zu archivieren, die keinen "herkömmlichen" Schriftsätzen zugehörig sind. Diese Studienarbeit stellt Merkmalsextraktionsverfahren vor, die aus einem gegebenen Teil (Segment) eines Dokumentenscans Merkmale extrahieren, die es ermöglichen sollen, diesen mittels eines Klassifikationsverfahrens einer Klasse Textblock oder einer Klasse Grafikblock zuzuordnen. Zusätzlich werden zwei Klassifikationsverfahren, ein Entscheidungsbaum und eine Fuzzy-Logik, auf die Nutzbarkeit für einen solchen Mustererkennungsprozess überprüft. Als Textblöcke erkannte Bereiche werden im zu entwickelnden Gesamtverfahren dann in nachfolgenden Verarbeitungsschritten einer Vektorisierung zugeführt. info:eu-repo/classification/ddc/004 ddc:004 Bildverarbeitung Entscheidungsbaum Fuzzy-Logik Klassifikation Künstliche Intelligenz Merkmalsextraktion Mustererkennung OCR-Schrift Blockerkennung Textidentifikation Poller, Andreas Technische Universität Chemnitz 2005-11-20 info:eu-repo/semantics/openAccess doc-type:StudyThesis info:eu-repo/semantics/StudyThesis doc-type:Text https://monarch.qucosa.de/id/qucosa%3A18403 https://monarch.qucosa.de/api/qucosa%3A18403/attachment/ATT-0/ https://monarch.qucosa.de/api/qucosa%3A18403/attachment/ATT-1/
collection NDLTD
language German
sources NDLTD
topic info:eu-repo/classification/ddc/004
ddc:004
Bildverarbeitung
Entscheidungsbaum
Fuzzy-Logik
Klassifikation
Künstliche Intelligenz
Merkmalsextraktion
Mustererkennung
OCR-Schrift
Blockerkennung
Textidentifikation
spellingShingle info:eu-repo/classification/ddc/004
ddc:004
Bildverarbeitung
Entscheidungsbaum
Fuzzy-Logik
Klassifikation
Künstliche Intelligenz
Merkmalsextraktion
Mustererkennung
OCR-Schrift
Blockerkennung
Textidentifikation
Poller, Andreas
Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern
description Am Institut für Print- und Medientechnik an der TU Chemnitz wird ein System entwickelt, welches gescannte Dokumente archivieren soll. Im Gegensatz zu bereits existierenden OCR-Systemen, sollen diese Dokumente hier jedoch nicht mittels einer Schrifterkennung verarbeitet werden. Vielmehr sind Textbereiche in den gescannten Vorlagen zu vektorisieren. Bereiche mit Grafiken und Illustrationen werden bei diesem Verfahren als ein Bildvektor gespeichert. Diese Vorgehensweise soll es ermöglichen, auch Dokumente mit Schriftsymbolen effizient zu archivieren, die keinen "herkömmlichen" Schriftsätzen zugehörig sind. Diese Studienarbeit stellt Merkmalsextraktionsverfahren vor, die aus einem gegebenen Teil (Segment) eines Dokumentenscans Merkmale extrahieren, die es ermöglichen sollen, diesen mittels eines Klassifikationsverfahrens einer Klasse Textblock oder einer Klasse Grafikblock zuzuordnen. Zusätzlich werden zwei Klassifikationsverfahren, ein Entscheidungsbaum und eine Fuzzy-Logik, auf die Nutzbarkeit für einen solchen Mustererkennungsprozess überprüft. Als Textblöcke erkannte Bereiche werden im zu entwickelnden Gesamtverfahren dann in nachfolgenden Verarbeitungsschritten einer Vektorisierung zugeführt.
author2 Technische Universität Chemnitz
author_facet Technische Universität Chemnitz
Poller, Andreas
author Poller, Andreas
author_sort Poller, Andreas
title Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern
title_short Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern
title_full Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern
title_fullStr Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern
title_full_unstemmed Merkmalsextraktion für die Klassifikation von Bestandteilen in Dokument-Bildern
title_sort merkmalsextraktion für die klassifikation von bestandteilen in dokument-bildern
publishDate 2005
url http://nbn-resolving.de/urn:nbn:de:swb:ch1-200501550
https://monarch.qucosa.de/id/qucosa%3A18403
https://monarch.qucosa.de/api/qucosa%3A18403/attachment/ATT-0/
https://monarch.qucosa.de/api/qucosa%3A18403/attachment/ATT-1/
work_keys_str_mv AT pollerandreas merkmalsextraktionfurdieklassifikationvonbestandteilenindokumentbildern
_version_ 1719392751315845120