Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia

Made available in DSpace on 2015-12-15T01:05:01Z (GMT). No. of bitstreams: 1 000476712-Texto+Completo-0.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015 === Some natural language processing tasks can be learned from example corpora, but having enough e...

Full description

Bibliographic Details
Main Author: Weber, Cristofer
Other Authors: Vieira, Renata
Language:Portuguese
Published: Pontifícia Universidade Católica do Rio Grande do Sul 2015
Subjects:
Online Access:http://hdl.handle.net/10923/7741
id ndltd-IBICT-urn-repox.ist.utl.pt-RI_PUC_RS-oai-meriva.pucrs.br-10923-7741
record_format oai_dc
spelling ndltd-IBICT-urn-repox.ist.utl.pt-RI_PUC_RS-oai-meriva.pucrs.br-10923-77412018-05-24T00:02:12Z Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia Weber, Cristofer Vieira, Renata INFORMÁTICA PROCESSAMENTO DA LINGUAGEM NATURAL LINGUÍSTICA COMPUTACIONAL Made available in DSpace on 2015-12-15T01:05:01Z (GMT). No. of bitstreams: 1 000476712-Texto+Completo-0.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015 Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências. 2015-12-15T01:05:01Z 2015-12-15T01:05:01Z 2015 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis http://hdl.handle.net/10923/7741 por info:eu-repo/semantics/openAccess Pontifícia Universidade Católica do Rio Grande do Sul Porto Alegre reponame:Repositório Institucional da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul instacron:PUC_RS
collection NDLTD
language Portuguese
sources NDLTD
topic INFORMÁTICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGUÍSTICA COMPUTACIONAL
spellingShingle INFORMÁTICA
PROCESSAMENTO DA LINGUAGEM NATURAL
LINGUÍSTICA COMPUTACIONAL
Weber, Cristofer
Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
description Made available in DSpace on 2015-12-15T01:05:01Z (GMT). No. of bitstreams: 1 000476712-Texto+Completo-0.pdf: 1416751 bytes, checksum: 0b603e0667dd53303efd13181a62d31e (MD5) Previous issue date: 2015 === Some natural language processing tasks can be learned from example corpora, but having enough examples for the task at hands can be a bottleneck. In this work we address how Wikipedia and DBpedia, two freely available language resources, can be used to support Named Entity Recognition, a fundamental task in Information Extraction and a necessary step of other tasks such as Co-reference Resolution and Relation Extraction. === Algumas tarefas de processamento de linguagem natural podem ser aprendidas por algoritmos a partir de corpus de exemplo, mas a obtenção destes exemplos pode ser um gargalo. Neste trabalho nós investigamos como a Wikipedia e a DBpedia, dois recursos de linguagem disponíveis de forma gratuita, podem ser utilizados como corpus para a classificação de entidades nomeadas, uma tarefa fundamental de extração de informações e um passo necessário para outras tarefas como extração de relações e resolução de co-referências.
author2 Vieira, Renata
author_facet Vieira, Renata
Weber, Cristofer
author Weber, Cristofer
author_sort Weber, Cristofer
title Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_short Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_fullStr Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_full_unstemmed Construção de um corpus anotado para classificação de entidades nomeadas utilizando a Wikipedia e a DBpedia
title_sort construção de um corpus anotado para classificação de entidades nomeadas utilizando a wikipedia e a dbpedia
publisher Pontifícia Universidade Católica do Rio Grande do Sul
publishDate 2015
url http://hdl.handle.net/10923/7741
work_keys_str_mv AT webercristofer construcaodeumcorpusanotadoparaclassificacaodeentidadesnomeadasutilizandoawikipediaeadbpedia
_version_ 1718679401492643840