Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951)
This article proposes use the Transkribus software to report on a "user experiment" in a French-speaking context. It is based on the semi-automated transcription project using the diary of the jurist Eugène Wilhelm (1866-1951). This diary presents two main challenges. The first is related...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
Nicolas Turenne
2020-08-01
|
Series: | Journal of Data Mining and Digital Humanities |
Subjects: | |
Online Access: | https://jdmdh.episciences.org/6736/pdf |
id |
doaj-ad32268e91fc4519a5cedd281be82d7a |
---|---|
record_format |
Article |
spelling |
doaj-ad32268e91fc4519a5cedd281be82d7a2021-02-22T16:19:09ZengNicolas TurenneJournal of Data Mining and Digital Humanities2416-59992020-08-01Atelier Digit_HumDigital humanities in languagesjdmdh:6736Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951)Régis SchlagdenhauffenThis article proposes use the Transkribus software to report on a "user experiment" in a French-speaking context. It is based on the semi-automated transcription project using the diary of the jurist Eugène Wilhelm (1866-1951). This diary presents two main challenges. The first is related to the time covered by the writing process-66 years. This leads to variations in the form of the writing, which becomes increasingly "unreadable" with time. The second challenge is related to the concomitant use of two alphabets: Roman for everyday text and Greek for private issues. After presenting the project and the specificities related to the use of the tool, the experiment presented in this contribution is structured around two aspects. Firstly, I will summarise the main obstacles encountered and the solutions provided to overcome them. Secondly, I will come back to the collaborative transcription experiment carried out with students in the classroom, presenting the difficulties observed and the solutions found to overcome them. In conclusion, I will propose an assessment of the use of this Human Text Recognition software in a French-speaking context and in a teaching situation. Cet article propose de restituer une « expérience utilisateur » du logiciel Transkribus en contexte francophone. Il s’appuie sur le projet de transcription semi-automatisée du journal intime du juriste Eugène Wilhelm (1866-1951). Ce journal comporte deux défis principaux : le premier est lié à la durée de la rédaction, 66 années, qui engendre des variations dans la forme de l’écriture, cette dernière devenant de plus en plus « illisible » le temps passant. Le second défi est lié à l’emploi concomitant de deux alphabets ; romain pour tout ce qui relève du quotidien et grec pour le for privé.L’expérience utilisateur restituée dans cette contribution s’articule autour de deux aspects. Dans un premier temps, après avoir présenté le projet et les spécificités liées à l’usage de l’outil, les principaux obstacles rencontrés et les solutions apportées pour y remédier seront synthétisés. Puis, je reviendrai sur l’expérience collaborative de transcription conduite avec des étudiants en salle de cours en présentant les difficultés observées et les solutions trouvées pour y remédier. En conclusion, je proposerai un bilan relatif à l’utilisation de ce logiciel d’HTR (Human Text Recognition) en contexte francophone et en situation d’enseignementhttps://jdmdh.episciences.org/6736/pdfteiuser experiencehuman text recognitionlearning processocr[info.eiah]computer science [cs]/technology for human learning |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Régis Schlagdenhauffen |
spellingShingle |
Régis Schlagdenhauffen Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951) Journal of Data Mining and Digital Humanities tei user experience human text recognition learning process ocr [info.eiah]computer science [cs]/technology for human learning |
author_facet |
Régis Schlagdenhauffen |
author_sort |
Régis Schlagdenhauffen |
title |
Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951) |
title_short |
Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951) |
title_full |
Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951) |
title_fullStr |
Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951) |
title_full_unstemmed |
Optical Recognition Assisted Transcription with Transkribus: The Experiment concerning Eugène Wilhelm's Personal Diary (1885-1951) Transcription assistée par reconnaissance optique avec Transkribus : L’expérience du journal intime d’Eugène Wilhelm (1885-1951) |
title_sort |
optical recognition assisted transcription with transkribus: the experiment concerning eugène wilhelm's personal diary (1885-1951) transcription assistée par reconnaissance optique avec transkribus : l’expérience du journal intime d’eugène wilhelm (1885-1951) |
publisher |
Nicolas Turenne |
series |
Journal of Data Mining and Digital Humanities |
issn |
2416-5999 |
publishDate |
2020-08-01 |
description |
This article proposes use the Transkribus software to report on a "user experiment" in a French-speaking context. It is based on the semi-automated transcription project using the diary of the jurist Eugène Wilhelm (1866-1951). This diary presents two main challenges. The first is related to the time covered by the writing process-66 years. This leads to variations in the form of the writing, which becomes increasingly "unreadable" with time. The second challenge is related to the concomitant use of two alphabets: Roman for everyday text and Greek for private issues. After presenting the project and the specificities related to the use of the tool, the experiment presented in this contribution is structured around two aspects. Firstly, I will summarise the main obstacles encountered and the solutions provided to overcome them. Secondly, I will come back to the collaborative transcription experiment carried out with students in the classroom, presenting the difficulties observed and the solutions found to overcome them. In conclusion, I will propose an assessment of the use of this Human Text Recognition software in a French-speaking context and in a teaching situation. Cet article propose de restituer une « expérience utilisateur » du logiciel Transkribus en contexte francophone. Il s’appuie sur le projet de transcription semi-automatisée du journal intime du juriste Eugène Wilhelm (1866-1951). Ce journal comporte deux défis principaux : le premier est lié à la durée de la rédaction, 66 années, qui engendre des variations dans la forme de l’écriture, cette dernière devenant de plus en plus « illisible » le temps passant. Le second défi est lié à l’emploi concomitant de deux alphabets ; romain pour tout ce qui relève du quotidien et grec pour le for privé.L’expérience utilisateur restituée dans cette contribution s’articule autour de deux aspects. Dans un premier temps, après avoir présenté le projet et les spécificités liées à l’usage de l’outil, les principaux obstacles rencontrés et les solutions apportées pour y remédier seront synthétisés. Puis, je reviendrai sur l’expérience collaborative de transcription conduite avec des étudiants en salle de cours en présentant les difficultés observées et les solutions trouvées pour y remédier. En conclusion, je proposerai un bilan relatif à l’utilisation de ce logiciel d’HTR (Human Text Recognition) en contexte francophone et en situation d’enseignement |
topic |
tei user experience human text recognition learning process ocr [info.eiah]computer science [cs]/technology for human learning |
url |
https://jdmdh.episciences.org/6736/pdf |
work_keys_str_mv |
AT regisschlagdenhauffen opticalrecognitionassistedtranscriptionwithtranskribustheexperimentconcerningeugenewilhelmspersonaldiary18851951transcriptionassisteeparreconnaissanceoptiqueavectranskribuslexperiencedujournalintimedeugenewilhelm18851951 |
_version_ |
1724256543851937792 |