Metodologia Computacional para Identificação de Sintagmas Nominais da Língua Portuguesa
Made available in DSpace on 2016-08-29T15:33:12Z (GMT). No. of bitstreams: 1 tese_3340_a13-furia.pdf: 1204054 bytes, checksum: 6bd0535e50d6ecfd469372fbce27e1a1 (MD5) Previous issue date: 2010-01-08 === Sintagmas são unidades de sentido e com função sintática dentro de uma frase, [Nicola 2008]. De...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Published: |
Universidade Federal do Espírito Santo
2016
|
Subjects: | |
Online Access: | http://repositorio.ufes.br/handle/10/4217 |
id |
ndltd-IBICT-oai-dspace2.ufes.br-10-4217 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-dspace2.ufes.br-10-42172019-01-21T18:26:59Z Metodologia Computacional para Identificação de Sintagmas Nominais da Língua Portuguesa MORELLATO, L. V. VILLAVICENCIO, A. Garcia, B.B. FREITAS, S. A. A. sintagmas nominais processamento linguagem natural recuper Made available in DSpace on 2016-08-29T15:33:12Z (GMT). No. of bitstreams: 1 tese_3340_a13-furia.pdf: 1204054 bytes, checksum: 6bd0535e50d6ecfd469372fbce27e1a1 (MD5) Previous issue date: 2010-01-08 Sintagmas são unidades de sentido e com função sintática dentro de uma frase, [Nicola 2008]. De maneira geral, as frases que compõem qualquer enunciado expressam um conteúdo por meio dos elementos e das combinações desses elementos que a língua proporciona. Dessa forma, vão se formando conjuntos e subconjuntos que funcionam como unidades sintáticas dentro da unidade maior que é a frase -- os sintagmas, que podem ser divididos em: sintagmas nominais e verbais. Dentre esses, os nominais representam maior interesse devido ao maior valor semântico contido. Os sintagmas nominais são utilizados em tarefas de Processamento de Linguagem Natural (PLN), como resolução de correferências (anáforas), construção automática de ontologias, em parses usados em textos médicos para geração de resumos e criação de vocabulário, ou ainda como uma etapa inicial em processos de análise sintática. Em Recuperação de Informação (RI) os sintagmas podem ser aplicados na criação de termos em sistemas de indexação e buscas de documentos, gerando resultados melhores. Esta dissertação propõe uma metodologia computacional para identificação de sintagmas nominais da língua portuguesa em documentos digitais escritos em linguagem natural. Nesse trabalho, é explicitada a metodologia adotada para identificar e extrair sintagmas nominais por meio do desenvolvimento do SISNOP -- Sistema Identificador de Sintagmas Nominais do Português. O SISNOP é um sistema composto por um conjunto de módulos e programas, capaz de interpretar textos irrestritos disponíveis em linguagem natural, através de análises morfológicas e sintáticas, a fim de recuperar sintagmas nominais. Alem disso, são obtidas informações sintáticas, como gênero, número e grau das palavras contidas nos sintagmas extraídos. O SISNOP testou, entre outros corpus, o CETENFolha, composto por mais 24 milhões de palavras, e o CETEMPúblico, com aproximadamente 180 milhões de palavras em português europeu, e muito utilizado em trabalhos da área. Foi obtido 98,12% e 94,59% de frases reconhecidas pelo sistema, obtendo mais de 24 milhões de sintagmas identificados. Os módulos do SISNOP: EM Etiquetador Morfológico, ISN Identificador de Sintagmas Nominais e IGNG Identificador de Gênero, Número e Grau, foram testados de maneira individual utilizando um conjunto de dados menor que o anterior, visto que, a análise dos resultados foi feita manualmente. O módulo identificador de sintagmas obteve precisão de 82,45% e abrangência de 69,20%. 2016-08-29T15:33:12Z 2016-07-11 2016-08-29T15:33:12Z 2010-01-08 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis MORELLATO, L. V., Metodologia Computacional para Identificação de Sintagmas Nominais da Língua Portuguesa http://repositorio.ufes.br/handle/10/4217 info:eu-repo/semantics/openAccess text Universidade Federal do Espírito Santo Mestrado em Informática Programa de Pós-Graduação em Informática UFES BR reponame:Repositório Institucional da UFES instname:Universidade Federal do Espírito Santo instacron:UFES |
collection |
NDLTD |
format |
Others
|
sources |
NDLTD |
topic |
sintagmas nominais processamento linguagem natural recuper |
spellingShingle |
sintagmas nominais processamento linguagem natural recuper MORELLATO, L. V. Metodologia Computacional para Identificação de Sintagmas Nominais da Língua Portuguesa |
description |
Made available in DSpace on 2016-08-29T15:33:12Z (GMT). No. of bitstreams: 1
tese_3340_a13-furia.pdf: 1204054 bytes, checksum: 6bd0535e50d6ecfd469372fbce27e1a1 (MD5)
Previous issue date: 2010-01-08 === Sintagmas são unidades de sentido e com função sintática dentro de uma frase, [Nicola 2008]. De maneira geral, as frases que compõem qualquer enunciado expressam um conteúdo por meio dos elementos e das combinações desses elementos que a língua proporciona. Dessa forma, vão se formando conjuntos e subconjuntos que funcionam como unidades sintáticas dentro da unidade maior que é a frase -- os sintagmas, que podem ser divididos em: sintagmas nominais e verbais. Dentre esses, os nominais representam maior interesse devido ao maior valor semântico contido.
Os sintagmas nominais são utilizados em tarefas de Processamento de Linguagem Natural (PLN), como resolução de correferências (anáforas), construção automática de ontologias, em parses usados em textos médicos para geração de resumos e criação de vocabulário, ou ainda como uma etapa inicial em processos de análise sintática. Em Recuperação de Informação (RI) os sintagmas podem ser aplicados na criação de termos em sistemas de indexação e buscas de documentos, gerando resultados melhores.
Esta dissertação propõe uma metodologia computacional para identificação de sintagmas nominais da língua portuguesa em documentos digitais escritos em linguagem natural. Nesse trabalho, é explicitada a metodologia adotada para identificar e extrair sintagmas nominais por meio do desenvolvimento do SISNOP -- Sistema Identificador de Sintagmas Nominais do Português. O SISNOP é um sistema composto por um conjunto de módulos e programas, capaz de interpretar textos irrestritos disponíveis em linguagem natural, através de análises morfológicas e sintáticas, a fim de recuperar sintagmas nominais. Alem disso, são obtidas informações sintáticas, como gênero, número e grau das palavras contidas nos sintagmas extraídos.
O SISNOP testou, entre outros corpus, o CETENFolha, composto por mais 24 milhões de palavras, e o CETEMPúblico, com aproximadamente 180 milhões de palavras em português europeu, e muito utilizado em trabalhos da área. Foi obtido 98,12% e 94,59% de frases reconhecidas pelo sistema, obtendo mais de 24 milhões de sintagmas identificados. Os módulos do SISNOP: EM Etiquetador Morfológico, ISN Identificador de Sintagmas Nominais e IGNG Identificador de Gênero, Número e Grau, foram testados de maneira individual utilizando um conjunto de dados menor que o anterior, visto que, a análise dos resultados foi feita manualmente. O módulo identificador de sintagmas obteve precisão de 82,45% e abrangência de 69,20%. |
author2 |
VILLAVICENCIO, A. |
author_facet |
VILLAVICENCIO, A. MORELLATO, L. V. |
author |
MORELLATO, L. V. |
author_sort |
MORELLATO, L. V. |
title |
Metodologia Computacional para Identificação de
Sintagmas Nominais da Língua Portuguesa |
title_short |
Metodologia Computacional para Identificação de
Sintagmas Nominais da Língua Portuguesa |
title_full |
Metodologia Computacional para Identificação de
Sintagmas Nominais da Língua Portuguesa |
title_fullStr |
Metodologia Computacional para Identificação de
Sintagmas Nominais da Língua Portuguesa |
title_full_unstemmed |
Metodologia Computacional para Identificação de
Sintagmas Nominais da Língua Portuguesa |
title_sort |
metodologia computacional para identificação de
sintagmas nominais da língua portuguesa |
publisher |
Universidade Federal do Espírito Santo |
publishDate |
2016 |
url |
http://repositorio.ufes.br/handle/10/4217 |
work_keys_str_mv |
AT morellatolv metodologiacomputacionalparaidentificacaodesintagmasnominaisdalinguaportuguesa |
_version_ |
1718851770305740800 |