Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames

Made available in DSpace on 2019-03-30T00:01:50Z (GMT). No. of bitstreams: 0 Previous issue date: 2016-12-22 === The forensic work is of extreme relevance for police investigation and important material evidence during the stage of criminal trial. Computer science forensic work mainly involves ext...

Full description

Bibliographic Details
Main Author: Barreira, Ravi Veloso
Other Authors: Pinheiro, Vladia Celia Monteiro
Language:Portuguese
Published: Universidade de Fortaleza 2016
Subjects:
Online Access:https://uol.unifor.br/oul/ObraBdtdSiteTrazer.do?method=trazer&ns=true&obraCodigo=100611
http://dspace.unifor.br/handle/tede/100611
id ndltd-IBICT-oai-dspace.unifor.br-tede-100611
record_format oai_dc
collection NDLTD
language Portuguese
sources NDLTD
topic Semântica de programação
Linguagem de programação
Perícia judicial
spellingShingle Semântica de programação
Linguagem de programação
Perícia judicial
Barreira, Ravi Veloso
Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
description Made available in DSpace on 2019-03-30T00:01:50Z (GMT). No. of bitstreams: 0 Previous issue date: 2016-12-22 === The forensic work is of extreme relevance for police investigation and important material evidence during the stage of criminal trial. Computer science forensic work mainly involves extracting and analyzing data from smartphone-type mobile devices that are seized at crime scenes or in search and seizure operations. The Forensic Departments, however, can not meet the demand due to the growing number of requests and the volume of data and texts to analyze. The problem lies partly in the forensic tools used to analyze mobile instant messaging, which have low reliability in their results, and the dynamic nature of the linguistic expressions used by the suspects. This work proposes a methodology for automatic identification of messages of police interest using techniques of Natural Language Processing (PLN), specifically Semantic Role Labeling (SRL). The methodology is based on the semantics of frames that defines linguistic situations and the semantic roles involved. For example, it is possible to identify not only that a message contains terms that indicate a crime (drug trafficking) but also the elements involved in the crime (such as the drug marketed, the place of sale, the amounts involved etc.). Another contribution of the work was the definition of a database of forensic semantic frames - FrameFor.BR, generated from FrameNet. Experimental evaluations of the system and the FrameFor.BR base evidenced an increase in coverage in relation to the current approaches used by forensic experts, contributing to improve reliability and reduce the time required for compiling computer expert reports. Keywords: Computer forensic, FrameNet, natural language processing, mobile devices. === O trabalho pericial é de extrema relevância para investigação policial e importante prova material durante a etapa de processo penal. A perícia de computação envolve, principalmente, a extração e análise de dados de dispositivos móveis do tipo smartphones que são apreendidos em locais de crime ou em operações de busca e apreensão. Os institutos de perícias, porém, não conseguem atender à demanda devido à crescente quantidade de solicitações e ao volume de dados e textos para analisar. O problema está, em parte, nas ferramentas forenses utilizadas para análise de mensagens instantâneas de dispositivos móveis, as quais apresentam baixa confiabilidade em seus resultados, além do caráter dinâmico das expressões linguísticas utilizadas pelos suspeitos, sendo necessária a completa leitura do material analisado, pelos peritos. Esse trabalho propõe uma metodologia para identificação automática de mensagens de interesse policial através do uso de técnicas de Processamento de Linguagem Natural (PLN), especificamente de anotação de papeis semânticos (em inglês, Semantic Role Labeling - SRL). A metodologia é baseada na semântica de frames que define situações linguísticas e os papéis semânticos envolvidos. Por exemplo, é possível identificar não somente que uma mensagem contém termos que indiciam um crime (tráfico de drogas) mas também os elementos envolvidos no crime (como a droga comercializada, local da venda, valores envolvidos etc). Outra contribuição do trabalho, foi a definição de uma base de frames semânticos forenses - FrameFor.BR, gerada a partir da FrameNet. Avaliações experimentais do sistema e da base FrameFor.BR evidenciaram um aumento na cobertura em relação as atuais abordagens utilizadas pelos peritos forenses, contribuindo para melhoria da confiabilidade e na redução do tempo necessário para elaboração de laudos periciais de informática. Palavras-chave: Computação forense, FrameNet, processamento de linguagem natural, dispositivos móveis.
author2 Pinheiro, Vladia Celia Monteiro
author_facet Pinheiro, Vladia Celia Monteiro
Barreira, Ravi Veloso
author Barreira, Ravi Veloso
author_sort Barreira, Ravi Veloso
title Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
title_short Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
title_full Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
title_fullStr Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
title_full_unstemmed Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
title_sort anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
publisher Universidade de Fortaleza
publishDate 2016
url https://uol.unifor.br/oul/ObraBdtdSiteTrazer.do?method=trazer&ns=true&obraCodigo=100611
http://dspace.unifor.br/handle/tede/100611
work_keys_str_mv AT barreiraraviveloso anotacaodepapeissemanticosemtextosparaapoiarainvestigacaopolicialutilizandosemanticadeframes
AT barreiraraviveloso semanticrolelabellingintextstosupportpoliceinvestigationusingsemanticframesingles
_version_ 1719008945043931136
spelling ndltd-IBICT-oai-dspace.unifor.br-tede-1006112019-04-02T07:40:38Z Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames SEMANTIC ROLE LABELLING IN TEXTS TO SUPPORT POLICE INVESTIGATION USING SEMANTIC FRAMES (Inglês) Barreira, Ravi Veloso Pinheiro, Vladia Celia Monteiro Furtado, João José Vasco Peixoto Furtado, João José Vasco Peixoto Mendes, Marília Soares Vasconcelos Filho, José Eurico de Pinheiro, Vladia Celia Monteiro Semântica de programação Linguagem de programação Perícia judicial Made available in DSpace on 2019-03-30T00:01:50Z (GMT). No. of bitstreams: 0 Previous issue date: 2016-12-22 The forensic work is of extreme relevance for police investigation and important material evidence during the stage of criminal trial. Computer science forensic work mainly involves extracting and analyzing data from smartphone-type mobile devices that are seized at crime scenes or in search and seizure operations. The Forensic Departments, however, can not meet the demand due to the growing number of requests and the volume of data and texts to analyze. The problem lies partly in the forensic tools used to analyze mobile instant messaging, which have low reliability in their results, and the dynamic nature of the linguistic expressions used by the suspects. This work proposes a methodology for automatic identification of messages of police interest using techniques of Natural Language Processing (PLN), specifically Semantic Role Labeling (SRL). The methodology is based on the semantics of frames that defines linguistic situations and the semantic roles involved. For example, it is possible to identify not only that a message contains terms that indicate a crime (drug trafficking) but also the elements involved in the crime (such as the drug marketed, the place of sale, the amounts involved etc.). Another contribution of the work was the definition of a database of forensic semantic frames - FrameFor.BR, generated from FrameNet. Experimental evaluations of the system and the FrameFor.BR base evidenced an increase in coverage in relation to the current approaches used by forensic experts, contributing to improve reliability and reduce the time required for compiling computer expert reports. Keywords: Computer forensic, FrameNet, natural language processing, mobile devices. O trabalho pericial é de extrema relevância para investigação policial e importante prova material durante a etapa de processo penal. A perícia de computação envolve, principalmente, a extração e análise de dados de dispositivos móveis do tipo smartphones que são apreendidos em locais de crime ou em operações de busca e apreensão. Os institutos de perícias, porém, não conseguem atender à demanda devido à crescente quantidade de solicitações e ao volume de dados e textos para analisar. O problema está, em parte, nas ferramentas forenses utilizadas para análise de mensagens instantâneas de dispositivos móveis, as quais apresentam baixa confiabilidade em seus resultados, além do caráter dinâmico das expressões linguísticas utilizadas pelos suspeitos, sendo necessária a completa leitura do material analisado, pelos peritos. Esse trabalho propõe uma metodologia para identificação automática de mensagens de interesse policial através do uso de técnicas de Processamento de Linguagem Natural (PLN), especificamente de anotação de papeis semânticos (em inglês, Semantic Role Labeling - SRL). A metodologia é baseada na semântica de frames que define situações linguísticas e os papéis semânticos envolvidos. Por exemplo, é possível identificar não somente que uma mensagem contém termos que indiciam um crime (tráfico de drogas) mas também os elementos envolvidos no crime (como a droga comercializada, local da venda, valores envolvidos etc). Outra contribuição do trabalho, foi a definição de uma base de frames semânticos forenses - FrameFor.BR, gerada a partir da FrameNet. Avaliações experimentais do sistema e da base FrameFor.BR evidenciaram um aumento na cobertura em relação as atuais abordagens utilizadas pelos peritos forenses, contribuindo para melhoria da confiabilidade e na redução do tempo necessário para elaboração de laudos periciais de informática. Palavras-chave: Computação forense, FrameNet, processamento de linguagem natural, dispositivos móveis. 2016-12-22 2019-03-30T00:01:50Z 2016-12-22 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis https://uol.unifor.br/oul/ObraBdtdSiteTrazer.do?method=trazer&ns=true&obraCodigo=100611 http://dspace.unifor.br/handle/tede/100611 por 5443571202788449035 500 500 -7645770940771915222 info:eu-repo/semantics/openAccess Universidade de Fortaleza Mestrado Em Informática Aplicada UNIFOR Brasil Centro de Ciências Tecnológicas reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR instname:Universidade de Fortaleza instacron:UNIFOR