The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications
This article outlines the multiple use of electronic source materials from the Livonian-Estonian-Latvian Dictionary of 2012 in a “Kone Foundation” funded project for developing finite-state morphological parsers. It provides an introduction to the project, the language-independent Giellatekno infra...
Main Author: | |
---|---|
Format: | Article |
Language: | English |
Published: |
University of Tartu Press
2014-07-01
|
Series: | Eesti ja Soome-ugri Keeleteaduse Ajakiri |
Subjects: | |
Online Access: | https://ojs.utlib.ee/index.php/jeful/article/view/14987 |
id |
doaj-a34931777c754247b2fdb0472094b3e2 |
---|---|
record_format |
Article |
spelling |
doaj-a34931777c754247b2fdb0472094b3e22020-11-25T02:43:22ZengUniversity of Tartu PressEesti ja Soome-ugri Keeleteaduse Ajakiri1736-89872228-13392014-07-015110.12697/jeful.2014.5.1.14The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applicationsJack Rueter0Department of Modern Languages, University of Helsinki This article outlines the multiple use of electronic source materials from the Livonian-Estonian-Latvian Dictionary of 2012 in a “Kone Foundation” funded project for developing finite-state morphological parsers. It provides an introduction to the project, the language-independent Giellatekno infrastructure at Tromsø, Norway, and the materials utilized in the electronic manuscript of the dictionary. The introduction is followed by an extensive description of what has been developed on the Giellatekno infrastructure with explicit indications of where parallel projects might be initiated. Kokkuvõte. Jack Rueter: Liivi-eesti-läti sõnaraamat lävepakuna keeletehnoloogiliste rakenduste ajastusse. Artikkel annab ülevaate elektroonilise lähtematerjali “Liivi-eesti-läti sõnaraamat 2012” mitmekülgsest kasutamisest Kone fondi rahastatud projektis morfoloogiliste analüsaatorite arendamiseks. Artikli sissejuhatav osa esitab sissevaate projekti ning Tromsøs loodud keelest sõltumatusse Giellatekno taristusse; tutvustatakse ka sõnastiku elektroonilises käsikirjas kasutatud materjale. Seejärel kirjeldatakse Giellatekno tarkvara arendusega loodud võimalusi ning tuuakse näiteid sellest, kuidas saab sarnaseid projekte algatada. Märksõnad: liivi keel, uurali keeled, Kone keeleprogramm, avatud lähtekood, keelest sõltumatu infrastruktuur, HFST, Giellatekno, morfoloogiline analüsaator, õigekirjakontroll, “Morphology-savvy” veebisõnastik, arvutipõhine keeleõpe Kubbõvõttõks. Jack Rueter: Līvõkīel-ēstikīel-lețkīel sõnārǭntõz nemē kīeltehnolōgilizt kȭlbatimizt āiga kīndõks. Kēra āndab iļļõvaņtļimiz iļ “Līvõkīel-ēstikīel-lețkīel sõnārǭntõ” amāpūoļiz kȭlbatõmiz, laz kazāntõg loptõb morfolōgiliži analīzijidi. Sīe projektrǭ āndaji um Kone fond. Kēra klīerõb īžpīlijizt Giellatekno infrastruktūrõ, mis um lūodõd Tromsøs Norvēgjis, ja sõnārǭntõ elektrōnilizõs kädkēras kȭlbatõd materiālidi. Nei īž kēra nīžõb iļ võimizt, mis tarmõb Giellatekno lūodõd programvīļa ja nägțõb, kui tämvītliži projektidi võib irgtõ. https://ojs.utlib.ee/index.php/jeful/article/view/14987LivonianUralic languages“Kone” language programmeopen-sourcelanguage-independent infrastructureHFST |
collection |
DOAJ |
language |
English |
format |
Article |
sources |
DOAJ |
author |
Jack Rueter |
spellingShingle |
Jack Rueter The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications Eesti ja Soome-ugri Keeleteaduse Ajakiri Livonian Uralic languages “Kone” language programme open-source language-independent infrastructure HFST |
author_facet |
Jack Rueter |
author_sort |
Jack Rueter |
title |
The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications |
title_short |
The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications |
title_full |
The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications |
title_fullStr |
The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications |
title_full_unstemmed |
The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications |
title_sort |
livonian-estonian-latvian dictionary as a threshold to the era of language technological applications |
publisher |
University of Tartu Press |
series |
Eesti ja Soome-ugri Keeleteaduse Ajakiri |
issn |
1736-8987 2228-1339 |
publishDate |
2014-07-01 |
description |
This article outlines the multiple use of electronic source materials from the Livonian-Estonian-Latvian Dictionary of 2012 in a “Kone Foundation” funded project for developing finite-state morphological parsers. It provides an introduction to the project, the language-independent Giellatekno infrastructure at Tromsø, Norway, and the materials utilized in the electronic manuscript of the dictionary. The introduction is followed by an extensive description of what has been developed on the Giellatekno infrastructure with explicit indications of where parallel projects might be initiated.
Kokkuvõte. Jack Rueter: Liivi-eesti-läti sõnaraamat lävepakuna keeletehnoloogiliste rakenduste ajastusse. Artikkel annab ülevaate elektroonilise lähtematerjali “Liivi-eesti-läti sõnaraamat 2012” mitmekülgsest kasutamisest Kone fondi rahastatud projektis morfoloogiliste analüsaatorite arendamiseks. Artikli sissejuhatav osa esitab sissevaate projekti ning Tromsøs loodud keelest sõltumatusse Giellatekno taristusse; tutvustatakse ka sõnastiku elektroonilises käsikirjas kasutatud materjale. Seejärel kirjeldatakse Giellatekno tarkvara arendusega loodud võimalusi ning tuuakse näiteid sellest, kuidas saab sarnaseid projekte algatada.
Märksõnad: liivi keel, uurali keeled, Kone keeleprogramm, avatud lähtekood, keelest sõltumatu infrastruktuur, HFST, Giellatekno, morfoloogiline analüsaator, õigekirjakontroll, “Morphology-savvy” veebisõnastik, arvutipõhine keeleõpe
Kubbõvõttõks. Jack Rueter: Līvõkīel-ēstikīel-lețkīel sõnārǭntõz nemē kīeltehnolōgilizt kȭlbatimizt āiga kīndõks. Kēra āndab iļļõvaņtļimiz iļ “Līvõkīel-ēstikīel-lețkīel sõnārǭntõ” amāpūoļiz kȭlbatõmiz, laz kazāntõg loptõb morfolōgiliži analīzijidi. Sīe projektrǭ āndaji um Kone fond. Kēra klīerõb īžpīlijizt Giellatekno infrastruktūrõ, mis um lūodõd Tromsøs Norvēgjis, ja sõnārǭntõ elektrōnilizõs kädkēras kȭlbatõd materiālidi. Nei īž kēra nīžõb iļ võimizt, mis tarmõb Giellatekno lūodõd programvīļa ja nägțõb, kui tämvītliži projektidi võib irgtõ.
|
topic |
Livonian Uralic languages “Kone” language programme open-source language-independent infrastructure HFST |
url |
https://ojs.utlib.ee/index.php/jeful/article/view/14987 |
work_keys_str_mv |
AT jackrueter thelivonianestonianlatviandictionaryasathresholdtotheeraoflanguagetechnologicalapplications AT jackrueter livonianestonianlatviandictionaryasathresholdtotheeraoflanguagetechnologicalapplications |
_version_ |
1724769682852937728 |