Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar

CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016....

Full description

Bibliographic Details
Main Author: Carvalho, Cid Ivan da Costa
Other Authors: Araripe, Leonel Figueiredo de Alencar
Language:Portuguese
Published: 2016
Subjects:
Online Access:http://www.repositorio.ufc.br/handle/riufc/18202
id ndltd-IBICT-oai-www.repositorio.ufc.br-riufc-18202
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Linguistic variety Potiguar
Potigrafone
Atlas geolinguístico do litoral Potiguar
Língua portuguesa - Fonética
Língua portuguesa - Fonologia
Língua portuguesa - Transcrição fonética
spellingShingle Linguistic variety Potiguar
Potigrafone
Atlas geolinguístico do litoral Potiguar
Língua portuguesa - Fonética
Língua portuguesa - Fonologia
Língua portuguesa - Transcrição fonética
Carvalho, Cid Ivan da Costa
Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
description CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016. === Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T15:04:07Z No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) === Approved for entry into archive by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T17:10:52Z (GMT) No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) === Made available in DSpace on 2016-07-07T17:10:52Z (GMT). No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Previous issue date: 2016 === The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to the“potiguar” linguistic variety. It was through the development of this system, by using of the Atlas Linguístico do Centro-Oeste Potiguar and to the Atlas Geolinguístico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match. === O Potigrafone e um transdutor de estados finitos que faz a transcrição automática das formas gráficas da língua portuguesa para as formas fonéticas da variedade linguística potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrões fonéticos da variedade linguística potiguar, através do Atlas linguístico do Centro-Oeste potiguar e no Atlas Geolinguístico do Litoral Potiguar; apresentar uma ferramenta de transcrição fonética utilizando o alfabeto fonético Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de língua portuguesa por meio de duas medidas multiníveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessárias a identificação e a separação dos padrões fonológicos presentes nas cartas fonéticas dos Atlas supracitados; segundo, a definição de alguns critérios pertinentes as entradas (inputs) do sistema; terceiro, a implementação das regras que relacionam a forma subjacente com a forma superficial e; por último, a escolha das duas medidas adequadas a avaliação de um sistema que apresentava mais de uma forma de transcrição. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidão e nos acertos totais e parciais, no que se refere a transcrição sem a marcação da silaba tônica e sem os fenômenos fonéticos da nasalidade, da palatalização, da ditongação, da monotongação, do apagamento, da epêntese; outro resultado importante e que os módulos de consoantes e de núcleo silábico também interferem no desempenho, uma vez que os valores com todos os módulos e sem esses dois módulos se assemelham. O Potigrafone apresenta bom desempenho na transcrição fonética, mas existem alguns erros pontuais que torna necessário a constituição de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidão quanto na correspondência total e parcial da transcrição.
author2 Araripe, Leonel Figueiredo de Alencar
author_facet Araripe, Leonel Figueiredo de Alencar
Carvalho, Cid Ivan da Costa
author Carvalho, Cid Ivan da Costa
author_sort Carvalho, Cid Ivan da Costa
title Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_short Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_full Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_fullStr Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_full_unstemmed Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
title_sort transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar
publishDate 2016
url http://www.repositorio.ufc.br/handle/riufc/18202
work_keys_str_mv AT carvalhocidivandacosta transdutordeestadosfinitosparaconversaodegrafemaparaapronunciadavariedadelinguisticapotiguar
AT carvalhocidivandacosta finitestatetransducerforthegraphemeconversionofthepronunciationinthepotiguarlinguisticvariety
_version_ 1718834856336556032
spelling ndltd-IBICT-oai-www.repositorio.ufc.br-riufc-182022019-01-21T17:12:29Z Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar Finite state transducer for the grapheme conversion of the pronunciation in the potiguar linguistic variety Carvalho, Cid Ivan da Costa Araripe, Leonel Figueiredo de Alencar Linguistic variety Potiguar Potigrafone Atlas geolinguístico do litoral Potiguar Língua portuguesa - Fonética Língua portuguesa - Fonologia Língua portuguesa - Transcrição fonética CARVALHO, Cid Ivan da Costa. Transdutor de estados finitos para conversão de grafema para a pronúncia da variedade linguística potiguar. 2016. 161f. – Tese (Doutorado) – Universidade Federal do Ceará, Departamento de Letras Vernáculas, Programa de Pós-graduação em Linguística, Fortaleza (CE), 2016. Submitted by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T15:04:07Z No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Approved for entry into archive by Márcia Araújo (marcia_m_bezerra@yahoo.com.br) on 2016-07-07T17:10:52Z (GMT) No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Made available in DSpace on 2016-07-07T17:10:52Z (GMT). No. of bitstreams: 1 2016_tese_ciccarvalho.pdf: 2690180 bytes, checksum: 534323141ee66dc846d48a731de5eeb6 (MD5) Previous issue date: 2016 The Potigrafone is a finite-state transducer that automatically transcripts the graphic forms from the Portuguese language to the phonetic forms belonging to the“potiguar” linguistic variety. It was through the development of this system, by using of the Atlas Linguístico do Centro-Oeste Potiguar and to the Atlas Geolinguístico do Litoral Potiguar, that it has been possible to identify and separate the phonetic patterns in the linguistic variety belonging to the studied region, presenting a phonetic transcription tool while using the Speech Assessment Methods Phonetic Alphabet - SAMPA; and, in addition, a performance assessment in the corpus of written texts in Portuguese has been made through the use of two multi-level measures: Exact Match Ratio and Labelling Fscore. To do so, the identification and separation of phonological patterns present in the phonetic letters of Atlas, the definition of some relevant criteria to inputs in the system, the implementation of rules relating to underlying form with the surface form and, also, two system evaluation measures have been needed. The results have showed that the Potigrafone performance was 81% for the Exact Match Ratio measurement and 89% for the Labelling FScore, presenting thus, increased accuracy in total or partial correct attempts, when the transcript is made without stress markup and without the phonetic phenomena of nasality, the palatalization, the diphthongization, the monophthongization, the deletion, the epenthesis; another important result is that the consonant modules and the syllabic core also interfere with this performance, since the values with all modules and without these two modules are similar. The Potigrafone performs well during the phonetic transcription, but there are some occasional errors that have made necessary the creation of new rules to correct them and, consequently, help to improve the system performance, both in accuracy and in full and partial transcription match. O Potigrafone e um transdutor de estados finitos que faz a transcrição automática das formas gráficas da língua portuguesa para as formas fonéticas da variedade linguística potiguar. Com o desenvolvimento desse sistema, conseguimos identificar e separar os padrões fonéticos da variedade linguística potiguar, através do Atlas linguístico do Centro-Oeste potiguar e no Atlas Geolinguístico do Litoral Potiguar; apresentar uma ferramenta de transcrição fonética utilizando o alfabeto fonético Speech Assessment Methods Phonetic Alphabet (SAMPA) e, alem disso, conseguimos avaliar o desempenho do sistema em corpus de textos escritos de língua portuguesa por meio de duas medidas multiníveis: Exact Match Ratio e Labelling Fscore. Para isso, foram atendidos passos fundamentais: primeiro, foram necessárias a identificação e a separação dos padrões fonológicos presentes nas cartas fonéticas dos Atlas supracitados; segundo, a definição de alguns critérios pertinentes as entradas (inputs) do sistema; terceiro, a implementação das regras que relacionam a forma subjacente com a forma superficial e; por último, a escolha das duas medidas adequadas a avaliação de um sistema que apresentava mais de uma forma de transcrição. Os resultados mostram que o desempenho do Potigrafone foi de 81% para a medida Exact Match Ratio e 89% para a medida Labelling FScore, apresentando, assim, boa performance na exatidão e nos acertos totais e parciais, no que se refere a transcrição sem a marcação da silaba tônica e sem os fenômenos fonéticos da nasalidade, da palatalização, da ditongação, da monotongação, do apagamento, da epêntese; outro resultado importante e que os módulos de consoantes e de núcleo silábico também interferem no desempenho, uma vez que os valores com todos os módulos e sem esses dois módulos se assemelham. O Potigrafone apresenta bom desempenho na transcrição fonética, mas existem alguns erros pontuais que torna necessário a constituição de novas regras para corrigi-los e, consequentemente, melhorar o desempenho do sistema, tanto na exatidão quanto na correspondência total e parcial da transcrição. 2016-07-07T17:10:52Z 2016-07-07T17:10:52Z 2016 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis Carvalho, C. I. C.; Araripe, L. F. A. (2016) http://www.repositorio.ufc.br/handle/riufc/18202 por info:eu-repo/semantics/openAccess reponame:Repositório Institucional da UFC instname:Universidade Federal do Ceará instacron:UFC