Mineração de opiniões baseada em aspectos para revisões de medicamentos

Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:17:29Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) === Approved for entry into ar...

Full description

Bibliographic Details
Main Author: CAVALCANTI, Diana Cabral
Other Authors: http://lattes.cnpq.br/2984888073123287
Language:Portuguese
Published: Universidade Federal de Pernambuco 2018
Subjects:
Online Access:https://repositorio.ufpe.br/handle/123456789/25854
id ndltd-IBICT-oai-repositorio.ufpe.br-123456789-25854
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Inteligência artificial
Mineração de opiniões
Recuperação da informação
Revisões de medicamentos
spellingShingle Inteligência artificial
Mineração de opiniões
Recuperação da informação
Revisões de medicamentos
CAVALCANTI, Diana Cabral
Mineração de opiniões baseada em aspectos para revisões de medicamentos
description Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:17:29Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) === Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-24T21:19:39Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) === Made available in DSpace on 2018-08-24T21:19:39Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) Previous issue date: 2017-08-14 === CNPq === Mineração de Opinião baseada em Aspectos pode ser aplicada para extrair informações relevantes expressas por pacientes em comentários textuais sobre medicamentos (por exemplo, reações adversas, eficácia quanto ao uso de um determinado remédio, sintomas e condições do paciente antes usar o medicamento). Este novo domínio de aplicação apresenta desafios, bem como oportunidades de pesquisa em Mineração de Opinião. No entanto, a literatura ainda é escassa sobre métodos para extrair múltiplos aspectos relevantes presentes em análises de fármacos. Nesta tese foi desenvolvido um novo método para extrair e classificar aspectos em comentários opinativos sobre medicamentos. A solução proposta tem duas etapas principais. Na extração de aspectos, um novo método baseado em caminhos de dependência sintática é proposto para extrair pares de opiniões em revisões de medicamento. Um par de opinião é composto por um termo de aspecto associado a um termo opinativo. Na classificação de aspectos, propõe-se um classificador supervisionado baseado em recursos de domínio e de linguística para classificar pares de opinião por tipo de aspecto (por exemplo, Condição clínica, Reação Adversa, Dosagem e Eficácia). Para avaliar o método proposto, foram realizados experimentos em conjuntos de dados relacionados a três diferentes condições clínicas: ADHD, AIDS e Ansiedade. Para o problema de extração foi realizado avaliação comparativa com outros dois métodos, onde o método proposto atingiu resultados competitivos, alcançando precisão de 78% para ADHD, 75,2% para AIDS e 78,7% para Ansiedade. Enquanto para o problema de classificação, resultados promissores foram obtidos nos experimentos e várias questões foram identificadas e discutidas. === Aspect-based opinion mining can be applied to extract relevant information expressed by patients in drug reviews (e.g., adverse reactions, efficacy of a drug, symptoms and conditions of patients). This new domain of application presents challenges as well as opportunities for research in opinion mining. Nevertheless, the literature is still scarce of methods to extract multiple relevant aspects present in drug reviews. In this thesis we propose a new method to extract and classify aspects in drug reviews. The proposed solution has two main steps. In the aspect extraction, a new method based on syntactic dependency paths is proposed to extract opinion pairs in drug reviews, composed by an aspect term associated to opinion term. In the aspect classification, a supervised classifier is proposed based on domain and linguistics resources to classify the opinion pairs by aspect type (e.g., condition, adverse reaction, dosage and effectiveness). In order to evaluate the proposed method we conducted experiments with datasets related to three different diseases: ADHD, AIDS and Anxiety. For the extraction problem, a comparative evaluation was performed with two other methods, the proposed method obtained competitive results, obtained an accuracy of 78% for ADHD, 75.2% for AIDS and 78.7% for Anxiety. For the classification problem, promising results were obtained in the experiments and various issues were identified and discussed.
author2 http://lattes.cnpq.br/2984888073123287
author_facet http://lattes.cnpq.br/2984888073123287
CAVALCANTI, Diana Cabral
author CAVALCANTI, Diana Cabral
author_sort CAVALCANTI, Diana Cabral
title Mineração de opiniões baseada em aspectos para revisões de medicamentos
title_short Mineração de opiniões baseada em aspectos para revisões de medicamentos
title_full Mineração de opiniões baseada em aspectos para revisões de medicamentos
title_fullStr Mineração de opiniões baseada em aspectos para revisões de medicamentos
title_full_unstemmed Mineração de opiniões baseada em aspectos para revisões de medicamentos
title_sort mineração de opiniões baseada em aspectos para revisões de medicamentos
publisher Universidade Federal de Pernambuco
publishDate 2018
url https://repositorio.ufpe.br/handle/123456789/25854
work_keys_str_mv AT cavalcantidianacabral mineracaodeopinioesbaseadaemaspectospararevisoesdemedicamentos
_version_ 1718865527610277888
spelling ndltd-IBICT-oai-repositorio.ufpe.br-123456789-258542019-01-21T19:28:45Z Mineração de opiniões baseada em aspectos para revisões de medicamentos CAVALCANTI, Diana Cabral http://lattes.cnpq.br/2984888073123287 PRUDÊNCIO, Ricardo Bastos Cavalcante Inteligência artificial Mineração de opiniões Recuperação da informação Revisões de medicamentos Submitted by Fernanda Rodrigues de Lima (fernanda.rlima@ufpe.br) on 2018-08-20T19:17:29Z No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) Approved for entry into archive by Alice Araujo (alice.caraujo@ufpe.br) on 2018-08-24T21:19:39Z (GMT) No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) Made available in DSpace on 2018-08-24T21:19:39Z (GMT). No. of bitstreams: 2 license_rdf: 811 bytes, checksum: e39d27027a6cc9cb039ad269a5db8e34 (MD5) TESE Diana Cabral.pdf: 7941268 bytes, checksum: 4fda0e3a1cda7182e730ec1bbdd647bc (MD5) Previous issue date: 2017-08-14 CNPq Mineração de Opinião baseada em Aspectos pode ser aplicada para extrair informações relevantes expressas por pacientes em comentários textuais sobre medicamentos (por exemplo, reações adversas, eficácia quanto ao uso de um determinado remédio, sintomas e condições do paciente antes usar o medicamento). Este novo domínio de aplicação apresenta desafios, bem como oportunidades de pesquisa em Mineração de Opinião. No entanto, a literatura ainda é escassa sobre métodos para extrair múltiplos aspectos relevantes presentes em análises de fármacos. Nesta tese foi desenvolvido um novo método para extrair e classificar aspectos em comentários opinativos sobre medicamentos. A solução proposta tem duas etapas principais. Na extração de aspectos, um novo método baseado em caminhos de dependência sintática é proposto para extrair pares de opiniões em revisões de medicamento. Um par de opinião é composto por um termo de aspecto associado a um termo opinativo. Na classificação de aspectos, propõe-se um classificador supervisionado baseado em recursos de domínio e de linguística para classificar pares de opinião por tipo de aspecto (por exemplo, Condição clínica, Reação Adversa, Dosagem e Eficácia). Para avaliar o método proposto, foram realizados experimentos em conjuntos de dados relacionados a três diferentes condições clínicas: ADHD, AIDS e Ansiedade. Para o problema de extração foi realizado avaliação comparativa com outros dois métodos, onde o método proposto atingiu resultados competitivos, alcançando precisão de 78% para ADHD, 75,2% para AIDS e 78,7% para Ansiedade. Enquanto para o problema de classificação, resultados promissores foram obtidos nos experimentos e várias questões foram identificadas e discutidas. Aspect-based opinion mining can be applied to extract relevant information expressed by patients in drug reviews (e.g., adverse reactions, efficacy of a drug, symptoms and conditions of patients). This new domain of application presents challenges as well as opportunities for research in opinion mining. Nevertheless, the literature is still scarce of methods to extract multiple relevant aspects present in drug reviews. In this thesis we propose a new method to extract and classify aspects in drug reviews. The proposed solution has two main steps. In the aspect extraction, a new method based on syntactic dependency paths is proposed to extract opinion pairs in drug reviews, composed by an aspect term associated to opinion term. In the aspect classification, a supervised classifier is proposed based on domain and linguistics resources to classify the opinion pairs by aspect type (e.g., condition, adverse reaction, dosage and effectiveness). In order to evaluate the proposed method we conducted experiments with datasets related to three different diseases: ADHD, AIDS and Anxiety. For the extraction problem, a comparative evaluation was performed with two other methods, the proposed method obtained competitive results, obtained an accuracy of 78% for ADHD, 75.2% for AIDS and 78.7% for Anxiety. For the classification problem, promising results were obtained in the experiments and various issues were identified and discussed. 2018-08-24T21:19:39Z 2018-08-24T21:19:39Z 2017-08-14 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/doctoralThesis https://repositorio.ufpe.br/handle/123456789/25854 por Attribution-NonCommercial-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nc-nd/3.0/br/ info:eu-repo/semantics/embargoedAccess Universidade Federal de Pernambuco Programa de Pos Graduacao em Ciencia da Computacao UFPE Brasil reponame:Repositório Institucional da UFPE instname:Universidade Federal de Pernambuco instacron:UFPE