Anotação de Sentidos de Verbos em Textos Jornalísticos do Corpus CSTNews

Um dos problemas mais difíceis de serem tratados no Processamento de Linguagem Natural (PLN) é a ambiguidade lexical, pois as palavras podem expressar sentidos distintos de acordo com o contexto no qual elas ocorrem. Em PLN, a tarefa responsável por determinar o sentido adequado de uma palavra em co...

Full description

Bibliographic Details
Main Authors: Marco Antonio Sobrevilla Cabezudo, Erick Galani Maziero, Jackson Wilke da Cruz Souza, Márcio de Souza Dias, Paula Christina Figueira Cardoso, Pedro Paulo Balage Filho, Verônica Agostini, Fernando Antônio Asevedo Nóbrega, Cláudia Dias de Barros, Ariani Di Felippo, Thiago Alexandre Salgueiro Pardo
Format: Article
Language:English
Published: Universidade Federal de Minas Gerais 2015-12-01
Series:Revista de Estudos da Linguagem
Online Access:http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/8921
Description
Summary:Um dos problemas mais difíceis de serem tratados no Processamento de Linguagem Natural (PLN) é a ambiguidade lexical, pois as palavras podem expressar sentidos distintos de acordo com o contexto no qual elas ocorrem. Em PLN, a tarefa responsável por determinar o sentido adequado de uma palavra em contexto é a Desambiguação Lexical de Sentido (DLS). Nessa tarefa, o uso de corpus anotado é muito útil, pois esse recurso linguístico computacional permite o estudo mais aprofundado da ambiguidade, assim como o desenvolvimento e a avaliação de métodos de DLS. O presente trabalho relata o processo de anotação de sentidos dos verbos em textos jornalísticos presentes no corpus CSTNews, usando-se a WordNet de Princeton como repositório de sentidos. As contribuições deste trabalho incluem a disponibilização de um recurso linguístico que serve de base para futuras pesquisas em DLS para o português, além de detalhar o processo de anotação e seus resultados.
ISSN:0104-0588
2237-2083