Summary: | Made available in DSpace on 2014-06-11T19:26:48Z (GMT). No. of bitstreams: 0
Previous issue date: 2011-06-30Bitstream added on 2014-06-13T20:15:46Z : No. of bitstreams: 1
piruzelli_mpf_me_arafcl.pdf: 894358 bytes, checksum: b6e1cfef4808160d866865a9c6f46319 (MD5) === Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES) === Ao abordar a tradução automática (TA), esta pesquisa insere-se no domínio do Processamento Automático de Língua Natural (PLN), defendendo a hipótese de que se faz necessária a inclusão, nos sistemas de TA, de um módulo de resolução de ambiguidades que ao menos forneça ao usuário as diferentes leituras de frases ambíguas. Norteia-se por estes dois objetivos: (i) propor, de modo sistemático e com exemplificações, uma tipologia dos principais tipos de ambiguidade linguística do inglês; (ii) avaliar, de modo exploratório, o impacto das ambiguidades estudadas em (i) sobre a TA com o auxílio do Google Tradutor; (iii) explorar estratégias de resolução de ambiguidades. A metodologia que norteia o estudo distribui a investigação nos domínios linguístico e linguístico-computacional. No primeiro, com foco no inglês, introduz-se a problemática geral das ambiguidades linguísticas que se manifestam na TA de frases/parágrafos de textos em inglês para o português e procede-se à sistematização, com exemplos, dos tipos de ambiguidades linguísticas selecionados na literatura sobre PLN. No segundo domínio, avalia-se, por meio do Google Tradutor, o impacto dos tipos de ambiguidades sistematizados no domínio linguístico sobre as TAs de frases selecionadas do corpus paralelo inglês-português selecionado para o estudo e a adequação das TAs, tendo como parâmetros, para a análise da qualidade das TAs, as diferentes leituras potenciais das frases e as traduções realizadas por humanos e selecionadas do corpus. As considerações finais resumem o trabalho, apresentam possíveis desdobramentos da investigação e enfatizam o papel decisivo que um módulo de detecção e resolução de ambiguidades pode exercer na qualidade das TAs ao resolvêlas ou apontar, para o usuário, diferentes leituras de uma sentença ambígua no contexto dos tipos de ambiguidade que é capaz de detectar. === On taking up the study of linguistic ambiguities and machine translation (MT), this thesis unfolds against the backdrop of NLP (Natural Language Processing). It claims that MT systems, no matter whether they are couched in the symbolic or the statistical frameworks, should be equipped with a sort of disambiguation resolution module. In particular, it focuses on: (i) describing and exemplifying the core types of linguistic ambiguities in English in the context of the MT from English into Portuguese; (ii) explore, by means of the use of Google Translator, the impact of ambiguities on its Portuguese output from original English sentences; and (iii) sketch ambiguity resolution strategies for selected types. From the methodological point of view, the study is carried over the linguistic and computational-linguistic domains. In the former, it is discussed the different sorts of linguistic ambiguities by means of sample data collected from the NLP literature on ambiguity resolution investigation in English texts. In the latter, sample sentences were first selected in a parallel, English-Portuguese corpus, and then tested for their adequacy against the impact of the ambiguity types they illustrate. Sentence potential readings and their human translation counterparts were taken as parameters for the evaluation. The final remarks sum up the study, points out some of its further developments, and stress that the sample ambiguity resolution strategies explored in the study illustrates the key role a MT ambiguitiy detection and resolution module would play to improve the MT quality by either predicting them or by offering the user alternative readings of ambiguous sentences to choose from.
|