Analise de sentimento em documentos financeiros com múltiplas entidades

Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-17T16:03:10Z No. of bitstreams: 1 Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) === Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central...

Full description

Bibliographic Details
Main Author: Ferreira, Javier Zambreno
Other Authors: Cristo, Marco Antônio Pinheiro de
Format: Others
Language:Portuguese
Published: Universidade Federal do Amazonas 2015
Subjects:
Online Access:http://tede.ufam.edu.br/handle/tede/4122
Description
Summary:Submitted by Geyciane Santos (geyciane_thamires@hotmail.com) on 2015-06-17T16:03:10Z No. of bitstreams: 1 Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) === Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:27:39Z (GMT) No. of bitstreams: 1 Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) === Approved for entry into archive by Divisão de Documentação/BC Biblioteca Central (ddbc@ufam.edu.br) on 2015-06-17T20:29:11Z (GMT) No. of bitstreams: 1 Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) === Made available in DSpace on 2015-06-17T20:29:11Z (GMT). No. of bitstreams: 1 Dissertação- Javier zambrano Ferreira.pdf: 1147973 bytes, checksum: 97e9e41bf4b5d99b09151b69f9c99dfe (MD5) Previous issue date: 2014-02-25 === Não Informada === Given the amount of information available on the internet, it becomes unfeasible the manual content analysis to identify information of interest. Among such analyses, one of particular interest is the polarity analysis, that is, the classi cation of a text document in positive, negative, and neutral, according to a certain topic. This task is particularly useful in the nance domain, where news about a company can a ect the performance of its stocks. Although most of the methods about this domain consider that documents have only one polarity, in fact most of the documents cite many entities and these entities are often the target of the polarity analysis. Thus, in this work, we intend to study strategies for polarity detection in nancial documents with multiple entities. In particular, we study methods based on the learning of multiple models, one for each observed entity, using SVM classi ers. We evaluate models based on the partition of documents according to the entities they cite and on the segmentation of documents into fragments according to the entities they cite. To segment documents we use several heuristics based on shallow and deep natural language proecssing. We found that entity-speci c models created by simply partitioning the document collection largely outperformed strategies based on single models. === Dado o volume de infoma ção disponivel na Internet torna-se inviavel a analise manual do conteudo disponvel para identi car diversas informações de interesse. Entre v arias analises de interesse, uma de destaque e a an alise de polaridade da opinião, ou seja, a classificação de um documento textual em positivo, negativo ou neutro, em rela cão a um certo topico. Esta tarefa e particularmente util no dom nio fi nanceiro, onde not cias sobre uma empresa podem afetar o seu desempenho em mercados de a cões. Embora a maioria dos m etodos nesse dom nio considere que os documentos possuem uma unica polaridade, observamos que a maioria deles e constitudo de multiplas entidades e o alvo da analise de polaridade e, em geral, as entidades que estes documentos referenciam. O objetivo deste trabalho e, portanto, estudar estrategias para a detecção de polaridade em documentos financeiros com multiplas entidades. Para tanto, estudamos m etodos baseados na cria c~ao de multiplos modelos de aprendizado com um conjunto pr e-de nido de entidades, usando o classi cador SVM. N os avaliamos tanto modelos baseados em conjuntos de documentos especcos por entidade quanto modelos baseados em segmentação de documentos usando diversas heursticas de processamento de linguagem natural. Os resultados mostraram que h a um ganho em fragmentar os textos para an alise de polaridade com r otulos de classi ca cão por entidades.