Feature-level sentiment analysis applied to brazilian portuguese reviews

Made available in DSpace on 2015-05-22T12:36:36Z (GMT). No. of bitstreams: 1 000468945-Texto+Completo-0.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) Previous issue date: 2015 === Sentiment Analysis is the field of study that analyzes people’s opinions in texts. In the last d...

Full description

Bibliographic Details
Main Author: Freitas, Larissa Astrogildo de
Other Authors: Vieira, Renata
Language:Portuguese
Published: Pontifícia Universidade Católica do Rio Grande do Sul 2015
Subjects:
Online Access:http://hdl.handle.net/10923/7247
id ndltd-IBICT-urn-repox.ist.utl.pt-RI_PUC_RS-oai-meriva.pucrs.br-10923-7247
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic INFORMÁTICA
ONTOLOGIA
LINGUÍSTICA COMPUTACIONAL
PROCESSAMENTO DA LINGUAGEM NATURAL
spellingShingle INFORMÁTICA
ONTOLOGIA
LINGUÍSTICA COMPUTACIONAL
PROCESSAMENTO DA LINGUAGEM NATURAL
Freitas, Larissa Astrogildo de
Feature-level sentiment analysis applied to brazilian portuguese reviews
description Made available in DSpace on 2015-05-22T12:36:36Z (GMT). No. of bitstreams: 1 000468945-Texto+Completo-0.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) Previous issue date: 2015 === Sentiment Analysis is the field of study that analyzes people’s opinions in texts. In the last decade, humans have come to share their opinions in social media on the Web (e.g., forum discussions and posts in social network sites). Opinions are important because whenever we need to take a decision, we want to know others’ points of view. The interest of industry and academia in this field of study is partly due to its potential applications, such as: marketing, public relations and political campaign. Research in this field often considers English data, while data from other languages are less explored. It is possible realize data analysis in different levels, in this work we choose a finer-grain analysis, at aspect-level. Ontologies can represent aspects, that are “part-of” an object or property of “part-of” an object, we proposed a method for feature-level sentiment analysis using ontologies applied to Brazilian Portuguese reviews. In order to obtain a complete analysis, we recognized features explicit and implicit using ontologies. Relatively less work has been done about implicit feature identification. Finally, determine whether the sentiment in relation to the aspects is positive or negative using sentiment lexicons and linguistic rules. Our method is comprised of four steps: preprocessing, feature identification, polarity identification and summarizing. For evaluate this work, we apply our proposal method to a dataset of accommodation sector. According to our experiments, in general the best results were obtained when using TreeTagger, synsets with polarities from Onto. PT and linguistic rule (adjective position) for negative polarity identification and (baseline) for positive polarity identificatio === Análise de sentimento é o campo de estudo que analisa a opinião de pessoas em textos. Na última década, humanos têm compartilhado suas opiniões em mídias sociais na Web (por exemplo, fóruns de discussão e posts em sites de redes sociais). Opiniões são importantes porque sempre que necessitamos tomar uma decisão, queremos saber o ponto de vista de outras pessoas. O interesse da indústria e da academia neste campo de estudo se deve a aplicações potenciais, tais como: compra/venda, relações públicas e campanhas políticas. Pesquisas neste campo muitas vezes consideram dados em inglês, enquanto dados em outros idiomas são pouco explorados. É possível realizar a análise dos dados em diferentes níveis, neste trabalho optamos pela análise no nível de aspecto, na qual a granularidade é mais fina. Como ontologias podem ser utilizadas para representar aspectos, que são “parte-de” um objeto ou propriedade de “parte-de” um objeto, propomos um método para análise de sentimento aplicado a comentários em português brasileiro, sob o nível de aspecto usando ontologias. A fim de obter uma análise completa, reconhecemos aspectos explícitos e implícitos usando ontologias. Relativamente poucos trabalhos têm sido feitos sobre identificação de aspectos implícitos. Finalmente determinamos se o sentimento em relação aos aspectos é positivo ou negativo usando léxicos de sentimento e regras linguísticas. Nosso método é composto de quatro etapas: pré-processamento, identificação de aspecto, identificação de polaridade e sumarização. Para avaliar este trabalho, aplicamos o método proposto nos comentários do setor hoteleiro. De acordo com nosso experimento, o melhor resultado obtido foi quando utilizamos o TreeTagger, o synset com polaridade do Onto. PT e a regra linguística (posição do adjetivo) na identificação da polaridade negativa e (baseline) na identificação da polaridade positiva
author2 Vieira, Renata
author_facet Vieira, Renata
Freitas, Larissa Astrogildo de
author Freitas, Larissa Astrogildo de
author_sort Freitas, Larissa Astrogildo de
title Feature-level sentiment analysis applied to brazilian portuguese reviews
title_short Feature-level sentiment analysis applied to brazilian portuguese reviews
title_full Feature-level sentiment analysis applied to brazilian portuguese reviews
title_fullStr Feature-level sentiment analysis applied to brazilian portuguese reviews
title_full_unstemmed Feature-level sentiment analysis applied to brazilian portuguese reviews
title_sort feature-level sentiment analysis applied to brazilian portuguese reviews
publisher Pontifícia Universidade Católica do Rio Grande do Sul
publishDate 2015
url http://hdl.handle.net/10923/7247
work_keys_str_mv AT freitaslarissaastrogildode featurelevelsentimentanalysisappliedtobrazilianportuguesereviews
_version_ 1718679247961194496
spelling ndltd-IBICT-urn-repox.ist.utl.pt-RI_PUC_RS-oai-meriva.pucrs.br-10923-72472018-05-24T00:01:18Z Feature-level sentiment analysis applied to brazilian portuguese reviews Freitas, Larissa Astrogildo de Vieira, Renata INFORMÁTICA ONTOLOGIA LINGUÍSTICA COMPUTACIONAL PROCESSAMENTO DA LINGUAGEM NATURAL Made available in DSpace on 2015-05-22T12:36:36Z (GMT). No. of bitstreams: 1 000468945-Texto+Completo-0.pdf: 990591 bytes, checksum: 7d04b4b3b2f91050851802c6d65349f1 (MD5) Previous issue date: 2015 Sentiment Analysis is the field of study that analyzes people’s opinions in texts. In the last decade, humans have come to share their opinions in social media on the Web (e.g., forum discussions and posts in social network sites). Opinions are important because whenever we need to take a decision, we want to know others’ points of view. The interest of industry and academia in this field of study is partly due to its potential applications, such as: marketing, public relations and political campaign. Research in this field often considers English data, while data from other languages are less explored. It is possible realize data analysis in different levels, in this work we choose a finer-grain analysis, at aspect-level. Ontologies can represent aspects, that are “part-of” an object or property of “part-of” an object, we proposed a method for feature-level sentiment analysis using ontologies applied to Brazilian Portuguese reviews. In order to obtain a complete analysis, we recognized features explicit and implicit using ontologies. Relatively less work has been done about implicit feature identification. Finally, determine whether the sentiment in relation to the aspects is positive or negative using sentiment lexicons and linguistic rules. Our method is comprised of four steps: preprocessing, feature identification, polarity identification and summarizing. For evaluate this work, we apply our proposal method to a dataset of accommodation sector. According to our experiments, in general the best results were obtained when using TreeTagger, synsets with polarities from Onto. PT and linguistic rule (adjective position) for negative polarity identification and (baseline) for positive polarity identificatio Análise de sentimento é o campo de estudo que analisa a opinião de pessoas em textos. Na última década, humanos têm compartilhado suas opiniões em mídias sociais na Web (por exemplo, fóruns de discussão e posts em sites de redes sociais). Opiniões são importantes porque sempre que necessitamos tomar uma decisão, queremos saber o ponto de vista de outras pessoas. O interesse da indústria e da academia neste campo de estudo se deve a aplicações potenciais, tais como: compra/venda, relações públicas e campanhas políticas. Pesquisas neste campo muitas vezes consideram dados em inglês, enquanto dados em outros idiomas são pouco explorados. É possível realizar a análise dos dados em diferentes níveis, neste trabalho optamos pela análise no nível de aspecto, na qual a granularidade é mais fina. Como ontologias podem ser utilizadas para representar aspectos, que são “parte-de” um objeto ou propriedade de “parte-de” um objeto, propomos um método para análise de sentimento aplicado a comentários em português brasileiro, sob o nível de aspecto usando ontologias. A fim de obter uma análise completa, reconhecemos aspectos explícitos e implícitos usando ontologias. Relativamente poucos trabalhos têm sido feitos sobre identificação de aspectos implícitos. Finalmente determinamos se o sentimento em relação aos aspectos é positivo ou negativo usando léxicos de sentimento e regras linguísticas. Nosso método é composto de quatro etapas: pré-processamento, identificação de aspecto, identificação de polaridade e sumarização. Para avaliar este trabalho, aplicamos o método proposto nos comentários do setor hoteleiro. De acordo com nosso experimento, o melhor resultado obtido foi quando utilizamos o TreeTagger, o synset com polaridade do Onto. PT e a regra linguística (posição do adjetivo) na identificação da polaridade negativa e (baseline) na identificação da polaridade positiva 2015-05-22T12:36:36Z 2015-05-22T12:36:36Z 2015 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis http://hdl.handle.net/10923/7247 por info:eu-repo/semantics/openAccess Pontifícia Universidade Católica do Rio Grande do Sul Porto Alegre reponame:Repositório Institucional da PUC_RS instname:Pontifícia Universidade Católica do Rio Grande do Sul instacron:PUC_RS