Towards Application of Speech Act Theory to Opinion Mining

Towards the Application of Speech Act Theory to Opinion Mining The paper refers to the pragmatics’ perspective on opinion mining in Polish and English, inspired by the discrepancy between the coverage of sentiment analysis and the market demand. An analysis of speech acts expressed in opinion texts...

Full description

Bibliographic Details
Main Author: Agnieszka Magdalena Pluwak
Format: Article
Language:English
Published: Institute of Slavic Studies, Polish Academy of Sciences 2016-12-01
Series:Cognitive Studies | Études cognitives
Subjects:
Online Access:https://ispan.waw.pl/journals/index.php/cs-ec/article/view/1241
id doaj-494ba1106bbe44d4bf901fe0be86ddf1
record_format Article
spelling doaj-494ba1106bbe44d4bf901fe0be86ddf12020-11-24T23:41:23ZengInstitute of Slavic Studies, Polish Academy of SciencesCognitive Studies | Études cognitives2392-23972016-12-01016334410.11649/cs.2016.0041114Towards Application of Speech Act Theory to Opinion MiningAgnieszka Magdalena Pluwak0Instytut Slawistyki Polskiej Akademii Nauk [Institute of Slavic Studies, Polish Academy of Sciences], Warszawa [Warsaw]Towards the Application of Speech Act Theory to Opinion Mining The paper refers to the pragmatics’ perspective on opinion mining in Polish and English, inspired by the discrepancy between the coverage of sentiment analysis and the market demand. An analysis of speech acts expressed in opinion texts reveals that almost half of all opinions include ways of indirect evaluation that might not get extracted while applying traditional methods of sentiment analysis based on direct evaluative vocabulary and polarity lexicons. Coding of sentiment with respect to speech acts could vastly broaden data mining results within an NLP-system.   O zastosowaniu teorii aktów mowy w ekstrakcji danych z tekstów opinii internetowych Jedno z aktualnych zagadnień językoznawstwa komputerowego, jakim jest automatyczne badanie wydźwięku wypowiedzi, nie uwzględniło dotychczas w wystarczającym stopniu pragmatyki językoznawczej, np. aktów mowy Austina (1961) i Searla (1969), a zatem również implicytnych sposobów wyrażania ewaluacji. Tymczasem podejście od pragmatyki ku konstrukcjom przełożonym na reguły programistyczne umożliwiłoby nie tylko szersze spojrzenie na analizę sentymentu, ale też zbliżyłoby automat do sposobu, w jaki odbiera go człowiek. W szczególności chodzi tu sposoby wyrażania (nie)zadowolenia wykraczające poza poziom leksykalny (bez nacechowanej negatywnie leksyki), typu Nigdy więcej tam nie pójdę. Artykuł prezentuje: 1. aktualne podejścia do analizy wydźwięku w lingwistyce komputerowej, 2. propozycję zastosowania podejścia pragmatycznego, 3. wyniki badania próbki tekstów opinii internetowych pod kątem występowania w nich aktów mowy, 4. propozycję utworzenia reguł ekstrakcji danych na ich podstawie. Zaprezentowane podejście zakłada hipotezę wtórnej oralności, czyli tego, że język opinii jest zapisanym językiem mówionym.https://ispan.waw.pl/journals/index.php/cs-ec/article/view/1241sentiment analysisimplicit sentimentspeech acts
collection DOAJ
language English
format Article
sources DOAJ
author Agnieszka Magdalena Pluwak
spellingShingle Agnieszka Magdalena Pluwak
Towards Application of Speech Act Theory to Opinion Mining
Cognitive Studies | Études cognitives
sentiment analysis
implicit sentiment
speech acts
author_facet Agnieszka Magdalena Pluwak
author_sort Agnieszka Magdalena Pluwak
title Towards Application of Speech Act Theory to Opinion Mining
title_short Towards Application of Speech Act Theory to Opinion Mining
title_full Towards Application of Speech Act Theory to Opinion Mining
title_fullStr Towards Application of Speech Act Theory to Opinion Mining
title_full_unstemmed Towards Application of Speech Act Theory to Opinion Mining
title_sort towards application of speech act theory to opinion mining
publisher Institute of Slavic Studies, Polish Academy of Sciences
series Cognitive Studies | Études cognitives
issn 2392-2397
publishDate 2016-12-01
description Towards the Application of Speech Act Theory to Opinion Mining The paper refers to the pragmatics’ perspective on opinion mining in Polish and English, inspired by the discrepancy between the coverage of sentiment analysis and the market demand. An analysis of speech acts expressed in opinion texts reveals that almost half of all opinions include ways of indirect evaluation that might not get extracted while applying traditional methods of sentiment analysis based on direct evaluative vocabulary and polarity lexicons. Coding of sentiment with respect to speech acts could vastly broaden data mining results within an NLP-system.   O zastosowaniu teorii aktów mowy w ekstrakcji danych z tekstów opinii internetowych Jedno z aktualnych zagadnień językoznawstwa komputerowego, jakim jest automatyczne badanie wydźwięku wypowiedzi, nie uwzględniło dotychczas w wystarczającym stopniu pragmatyki językoznawczej, np. aktów mowy Austina (1961) i Searla (1969), a zatem również implicytnych sposobów wyrażania ewaluacji. Tymczasem podejście od pragmatyki ku konstrukcjom przełożonym na reguły programistyczne umożliwiłoby nie tylko szersze spojrzenie na analizę sentymentu, ale też zbliżyłoby automat do sposobu, w jaki odbiera go człowiek. W szczególności chodzi tu sposoby wyrażania (nie)zadowolenia wykraczające poza poziom leksykalny (bez nacechowanej negatywnie leksyki), typu Nigdy więcej tam nie pójdę. Artykuł prezentuje: 1. aktualne podejścia do analizy wydźwięku w lingwistyce komputerowej, 2. propozycję zastosowania podejścia pragmatycznego, 3. wyniki badania próbki tekstów opinii internetowych pod kątem występowania w nich aktów mowy, 4. propozycję utworzenia reguł ekstrakcji danych na ich podstawie. Zaprezentowane podejście zakłada hipotezę wtórnej oralności, czyli tego, że język opinii jest zapisanym językiem mówionym.
topic sentiment analysis
implicit sentiment
speech acts
url https://ispan.waw.pl/journals/index.php/cs-ec/article/view/1241
work_keys_str_mv AT agnieszkamagdalenapluwak towardsapplicationofspeechacttheorytoopinionmining
_version_ 1725507659048681472