Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016....
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
2016
|
Subjects: | |
Online Access: | http://www.repositorio.ufc.br/handle/riufc/18202 |
id |
ndltd-IBICT-oai-www.repositorio.ufc.br-riufc-18202 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Linguistic variety Potiguar Potigrafone Atlas geolinguístico do litoral Potiguar Língua portuguesa - Fonética Língua portuguesa - Fonologia Língua portuguesa - Transcrição fonética |
spellingShingle |
Linguistic variety Potiguar Potigrafone Atlas geolinguístico do litoral Potiguar Língua portuguesa - Fonética Língua portuguesa - Fonologia Língua portuguesa - Transcrição fonética Carvalho, Cid Ivan da Costa Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
description |
CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016. === Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T15:04:07Z
No. of bitstreams: 1
2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) === Approved for entry into archive by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T17:10:52Z (GMT) No. of bitstreams: 1
2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) === Made available in DSpace on 2016-07-07T17:10:52Z (GMT). No. of bitstreams: 1
2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5)
Previous issue date: 2016 === The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to the“potiguar” linguistic variety. It was through the development of this system, by using of the Atlas Linguístico do Centro-Oeste Potiguar and to the Atlas Geolinguístico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match. === O Potigrafone e um transdutor de estados finitos que faz a transcrição automática das formas gráficas da língua portuguesa para as formas fonéticas da variedade linguística potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrões fonéticos da variedade linguística potiguar, através do Atlas linguístico do Centro-Oeste potiguar e no Atlas Geolinguístico do Litoral Potiguar; apresentar uma ferramenta de transcrição fonética utilizando o alfabeto fonético Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de língua portuguesa por meio de duas medidas multiníveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessárias a identificação e a separação dos padrões fonológicos presentes nas cartas fonéticas dos Atlas supracitados; segundo, a definição de alguns critérios pertinentes as entradas (inputs) do sistema; terceiro, a implementação das regras que relacionam a forma subjacente com a forma superficial e; por último, a escolha das duas medidas adequadas a avaliação de um sistema que apresentava mais de uma forma de transcrição. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidão e nos acertos totais e parciais, no que se refere a transcrição sem a marcação da silaba tônica e sem os fenômenos fonéticos da nasalidade, da palatalização, da ditongação, da monotongação, do apagamento, da epêntese; outro resultado importante e que os módulos de consoantes e de núcleo silábico também interferem no desempenho, uma vez que os valores com todos os módulos e sem esses dois módulos se assemelham. O Potigrafone apresenta bom desempenho na transcrição fonética, mas existem alguns erros pontuais que torna necessário a constituição de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidão quanto na correspondência total e parcial da transcrição. |
author2 |
Araripe, Leonel Figueiredo de Alencar |
author_facet |
Araripe, Leonel Figueiredo de Alencar Carvalho, Cid Ivan da Costa |
author |
Carvalho, Cid Ivan da Costa |
author_sort |
Carvalho, Cid Ivan da Costa |
title |
Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
title_short |
Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
title_full |
Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
title_fullStr |
Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
title_full_unstemmed |
Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
title_sort |
transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar |
publishDate |
2016 |
url |
http://www.repositorio.ufc.br/handle/riufc/18202 |
work_keys_str_mv |
AT carvalhocidivandacosta transdutordeestadosfinitosparaconversaodegrafemaparaapronunciadavariedadelinguisticapotiguar AT carvalhocidivandacosta finitestatetransducerforthegraphemeconversionofthepronunciationinthepotiguarlinguisticvariety |
_version_ |
1718834856336556032 |
spelling |
ndltd-IBICT-oai-www.repositorio.ufc.br-riufc-182022019-01-21T17:12:29Z Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar Finite state transducer for the grapheme conversion of the pronunciation in the potiguar linguistic variety Carvalho, Cid Ivan da Costa Araripe, Leonel Figueiredo de Alencar Linguistic variety Potiguar Potigrafone Atlas geolinguístico do litoral Potiguar Língua portuguesa - Fonética Língua portuguesa - Fonologia Língua portuguesa - Transcrição fonética CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016. Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T15:04:07Z No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Approved for entry into archive by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T17:10:52Z (GMT) No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Made available in DSpace on 2016-07-07T17:10:52Z (GMT). No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Previous issue date: 2016 The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to the“potiguar” linguistic variety. It was through the development of this system, by using of the Atlas Linguístico do Centro-Oeste Potiguar and to the Atlas Geolinguístico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match. O Potigrafone e um transdutor de estados finitos que faz a transcrição automática das formas gráficas da língua portuguesa para as formas fonéticas da variedade linguística potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrões fonéticos da variedade linguística potiguar, através do Atlas linguístico do Centro-Oeste potiguar e no Atlas Geolinguístico do Litoral Potiguar; apresentar uma ferramenta de transcrição fonética utilizando o alfabeto fonético Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de língua portuguesa por meio de duas medidas multiníveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessárias a identificação e a separação dos padrões fonológicos presentes nas cartas fonéticas dos Atlas supracitados; segundo, a definição de alguns critérios pertinentes as entradas (inputs) do sistema; terceiro, a implementação das regras que relacionam a forma subjacente com a forma superficial e; por último, a escolha das duas medidas adequadas a avaliação de um sistema que apresentava mais de uma forma de transcrição. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidão e nos acertos totais e parciais, no que se refere a transcrição sem a marcação da silaba tônica e sem os fenômenos fonéticos da nasalidade, da palatalização, da ditongação, da monotongação, do apagamento, da epêntese; outro resultado importante e que os módulos de consoantes e de núcleo silábico também interferem no desempenho, uma vez que os valores com todos os módulos e sem esses dois módulos se assemelham. O Potigrafone apresenta bom desempenho na transcrição fonética, mas existem alguns erros pontuais que torna necessário a constituição de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidão quanto na correspondência total e parcial da transcrição. 2016-07-07T17:10:52Z 2016-07-07T17:10:52Z 2016 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis Carvalho, C. I. C.; Araripe, L. F. A. (2016) http://www.repositorio.ufc.br/handle/riufc/18202 por info:eu-repo/semantics/openAccess reponame:Repositório Institucional da UFC instname:Universidade Federal do Ceará instacron:UFC |