Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘
Diese Arbeit stellt ein ausführliches Konzept für die Digitalisierung von Campes sogenannten ‚Verdeutschungswörterbuch‘\(^1\) (1813). Campes Opus gilt als Schlüsselwerk für die Zeit um 1800 und ist deshalb sowohl von literaturhistorischem als auch von lexikographischem Interesse. Das Projekt umfa...
Main Author: | |
---|---|
Format: | Doctoral Thesis |
Language: | deu |
Published: |
2016
|
Subjects: | |
Online Access: | https://opus.bibliothek.uni-wuerzburg.de/frontdoor/index/index/docId/13319 http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-133196 https://nbn-resolving.org/urn:nbn:de:bvb:20-opus-133196 https://opus.bibliothek.uni-wuerzburg.de/files/13319/Dissertation_Grigorova_Stanislava.pdf https://opus.bibliothek.uni-wuerzburg.de/files/13319/Elektronischer_Anhang.zip |
id |
ndltd-uni-wuerzburg.de-oai-opus.bibliothek.uni-wuerzburg.de-13319 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
deu |
format |
Doctoral Thesis |
sources |
NDLTD |
topic |
ddc:400 |
spellingShingle |
ddc:400 Grigorova, Stanislava Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ |
description |
Diese Arbeit stellt ein ausführliches Konzept für die Digitalisierung von Campes sogenannten ‚Verdeutschungswörterbuch‘\(^1\) (1813). Campes Opus gilt als Schlüsselwerk für die Zeit um 1800 und ist deshalb sowohl von literaturhistorischem als auch von lexikographischem Interesse.
Das Projekt umfasst die wichtigsten konzeptuellen und praktischen Schritte der Erstellung einer digitalen Edition. Untersucht wird der Kontext, in dem die Vorlage zu sehen ist, nämlich Campes Arbeit an der Sprachreinigung und die Genese des ‚Verdeutschungswörterbuchs‘. Für die Texterfassung werden die Möglichkeiten aktueller Software für optische Zeichenerkennung (OCR, Optical Character Recognition) als mögliche Alternative zur Praxis des manuellen Abschreibens von Frakturtexten geprüft.
Im Kern des Projekts steht die tiefgehende Kodierung des elektronisch erfassten Textes nach den Richtlinien der ‚Text Encoding Initiative‘ (TEI), die die einzelnen lexikographischen Strukturen sichtbar und für weitere Bearbeitung zugänglich macht. Es wird näher auf jene Problemstellen eingegangen, die logische oder semantische Schwierigkeiten bei der Kodierung darstellen und an denen das TEI-Wörterbuch-Tagset den Ansprüchen eines Wörterbuchs aus dem 19. Jahrhundert möglicherweise nicht vollständig genügen kann und erweitert werden muss. Somit stellt das Projekt auch eine Fallstudie für die retrospektive Digitalisierung historischer Texte am Beispiel einer stark strukturierten Vorlage dar.
Die Vorteile der großen Erschließungstiefe für weiterführende Untersuchungen werden durch einen Vorschlag für die Präsentation der kodierten Daten und einige quantifizierende Abfragen dargelegt. Die vorgeschlagenen Arbeitsschritte werden parallel an einer repräsentativen Wörterbuchstrecke praktisch angewandt. Angestrebt wird, dass der Leser den gesamten Prozess vom papiergebundenen Original bis hin zur Onlinepräsentation verfolgen kann.
\(^1\) ‚Wörterbuch zur Erklärung und Verdeutschung der unserer Sprache aufgedrungenen fremden Ausdrücke. Ein Ergänzungsband zu Adelungs und Campes Wörterbüchern. Neue starkvermehrte und durchgängig verbesserte Ausgabe von Joachim Heinrich Campe, Doktor der Gottesgelehrtheit.‘ Braunschweig, 1813. === Campe's "Wörterbuch zur Erklärung und Verdeutschung der unserer Sprache aufgedrungenen fremden Ausdrücke" ("Dictionary for explaining and translating into German those foreign expressions which have forced their way into our language"), published in 1813, is considered a key piece for this period and is of interest for both lexicographers and literary-historians. This dissertation presents a comprehensive concept for the digitisation of the dictionary, and comprises the most important conceptual and practical steps in the creation of a digital edition. It gives an overview of the context surrounding the creation of the dictionary and Campe's writings on linguistic purism. The suitability of optical character recognition software for capturing the Gothic font text is tested and is found inferior to the manual transcription. The core of the work explores in detail the encoding of the dictionary structures based on the Text Encoding Initiative (TEI) guidelines that render each lexicographical structure visible and allow for further processing. A closer look is taken at areas that pose logical or semantic difficulties for encoding and where the TEI dictionary tag set does not fully meet the challenges of a 19th century dictionary and needs to be expanded. The advantages of this very detailed encoding for further linguistic studies are demonstrated by a series of quantified queries and by a proposal for the presentation of the encoded data. The work shows the entire digitisation process from the paper original to the online presentation. The encoding concept is tested by applying it to a representative sample of the dictionary and is proved to be robust for the encoding of the entire book. The dissertation can also be seen as a case study of digitisation of highly structured historical texts. |
author |
Grigorova, Stanislava |
author_facet |
Grigorova, Stanislava |
author_sort |
Grigorova, Stanislava |
title |
Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ |
title_short |
Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ |
title_full |
Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ |
title_fullStr |
Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ |
title_full_unstemmed |
Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ |
title_sort |
studien zur digitalisierung von campes ‚verdeutschungswörterbuch‘ |
publishDate |
2016 |
url |
https://opus.bibliothek.uni-wuerzburg.de/frontdoor/index/index/docId/13319 http://nbn-resolving.de/urn:nbn:de:bvb:20-opus-133196 https://nbn-resolving.org/urn:nbn:de:bvb:20-opus-133196 https://opus.bibliothek.uni-wuerzburg.de/files/13319/Dissertation_Grigorova_Stanislava.pdf https://opus.bibliothek.uni-wuerzburg.de/files/13319/Elektronischer_Anhang.zip |
work_keys_str_mv |
AT grigorovastanislava studienzurdigitalisierungvoncampesverdeutschungsworterbuch AT grigorovastanislava studiesfordigitisationoftheverdeutschungsworterbuchbyjhcampe |
_version_ |
1719246252941508608 |
spelling |
ndltd-uni-wuerzburg.de-oai-opus.bibliothek.uni-wuerzburg.de-133192019-09-07T16:26:58Z Studien zur Digitalisierung von Campes ‚Verdeutschungswörterbuch‘ Studies for digitisation of the ,Verdeutschungswörterbuch' by J. H. Campe Grigorova, Stanislava ddc:400 Diese Arbeit stellt ein ausführliches Konzept für die Digitalisierung von Campes sogenannten ‚Verdeutschungswörterbuch‘\(^1\) (1813). Campes Opus gilt als Schlüsselwerk für die Zeit um 1800 und ist deshalb sowohl von literaturhistorischem als auch von lexikographischem Interesse. Das Projekt umfasst die wichtigsten konzeptuellen und praktischen Schritte der Erstellung einer digitalen Edition. Untersucht wird der Kontext, in dem die Vorlage zu sehen ist, nämlich Campes Arbeit an der Sprachreinigung und die Genese des ‚Verdeutschungswörterbuchs‘. Für die Texterfassung werden die Möglichkeiten aktueller Software für optische Zeichenerkennung (OCR, Optical Character Recognition) als mögliche Alternative zur Praxis des manuellen Abschreibens von Frakturtexten geprüft. Im Kern des Projekts steht die tiefgehende Kodierung des elektronisch erfassten Textes nach den Richtlinien der ‚Text Encoding Initiative‘ (TEI), die die einzelnen lexikographischen Strukturen sichtbar und für weitere Bearbeitung zugänglich macht. Es wird näher auf jene Problemstellen eingegangen, die logische oder semantische Schwierigkeiten bei der Kodierung darstellen und an denen das TEI-Wörterbuch-Tagset den Ansprüchen eines Wörterbuchs aus dem 19. Jahrhundert möglicherweise nicht vollständig genügen kann und erweitert werden muss. Somit stellt das Projekt auch eine Fallstudie für die retrospektive Digitalisierung historischer Texte am Beispiel einer stark strukturierten Vorlage dar. Die Vorteile der großen Erschließungstiefe für weiterführende Untersuchungen werden durch einen Vorschlag für die Präsentation der kodierten Daten und einige quantifizierende Abfragen dargelegt. Die vorgeschlagenen Arbeitsschritte werden parallel an einer repräsentativen Wörterbuchstrecke praktisch angewandt. Angestrebt wird, dass der Leser den gesamten Prozess vom papiergebundenen Original bis hin zur Onlinepräsentation verfolgen kann. \(^1\) ‚Wörterbuch zur Erklärung und Verdeutschung der unserer Sprache aufgedrungenen fremden Ausdrücke. Ein Ergänzungsband zu Adelungs und Campes Wörterbüchern. Neue starkvermehrte und durchgängig verbesserte Ausgabe von Joachim Heinrich Campe, Doktor der Gottesgelehrtheit.‘ Braunschweig, 1813. Campe's "Wörterbuch zur Erklärung und Verdeutschung der unserer Sprache aufgedrungenen fremden Ausdrücke" ("Dictionary for explaining and translating into German those foreign expressions which have forced their way into our language"), published in 1813, is considered a key piece for this period and is of interest for both lexicographers and literary-historians. This dissertation presents a comprehensive concept for the digitisation of the dictionary, and comprises the most important conceptual and practical steps in the creation of a digital edition. It gives an overview of the context surrounding the creation of the dictionary and Campe's writings on linguistic purism. The suitability of optical character recognition software for capturing the Gothic font text is tested and is found inferior to the manual transcription. The core of the work explores in detail the encoding of the dictionary structures based on the Text Encoding Initiative (TEI) guidelines that render each lexicographical structure visible and allow for further processing. A closer look is taken at areas that pose logical or semantic difficulties for encoding and where the TEI dictionary tag set does not fully meet the challenges of a 19th century dictionary and needs to be expanded. The advantages of this very detailed encoding for further linguistic studies are demonstrated by a series of quantified queries and by a proposal for the presentation of the encoded data. The work shows the entire digitisation process from the paper original to the online presentation. The encoding concept is tested by applying it to a representative sample of the dictionary and is proved to be robust for the encoding of the entire book. The dissertation can also be seen as a case study of digitisation of highly structured historical texts. 2016 doctoralthesis doc-type:doctoralThesis application/pdf application/zip https://opus.bibliothek.uni-wuerzburg.de/frontdoor/index/index/docId/13319 urn:nbn:de:bvb:20-opus-133196 https://nbn-resolving.org/urn:nbn:de:bvb:20-opus-133196 https://opus.bibliothek.uni-wuerzburg.de/files/13319/Dissertation_Grigorova_Stanislava.pdf https://opus.bibliothek.uni-wuerzburg.de/files/13319/Elektronischer_Anhang.zip deu https://creativecommons.org/licenses/by-nc-sa/3.0/de/deed.de info:eu-repo/semantics/openAccess |