Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames
Made available in DSpace on 2019-03-30T00:01:50Z (GMT). No. of bitstreams: 0 Previous issue date: 2016-12-22 === The forensic work is of extreme relevance for police investigation and important material evidence during the stage of criminal trial. Computer science forensic work mainly involves ext...
Main Author: | |
---|---|
Other Authors: | |
Language: | Portuguese |
Published: |
Universidade de Fortaleza
2016
|
Subjects: | |
Online Access: | https://uol.unifor.br/oul/ObraBdtdSiteTrazer.do?method=trazer&ns=true&obraCodigo=100611 http://dspace.unifor.br/handle/tede/100611 |
id |
ndltd-IBICT-oai-dspace.unifor.br-tede-100611 |
---|---|
record_format |
oai_dc |
collection |
NDLTD |
language |
Portuguese |
sources |
NDLTD |
topic |
Semântica de programação Linguagem de programação Perícia judicial |
spellingShingle |
Semântica de programação Linguagem de programação Perícia judicial Barreira, Ravi Veloso Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
description |
Made available in DSpace on 2019-03-30T00:01:50Z (GMT). No. of bitstreams: 0
Previous issue date: 2016-12-22 === The forensic work is of extreme relevance for police investigation and important material evidence during the stage of criminal trial. Computer science forensic work mainly involves extracting and analyzing data from smartphone-type mobile devices that are seized at crime scenes or in search and seizure operations. The Forensic Departments, however, can not meet the demand due to the growing number of requests and the volume of data and texts to analyze. The problem lies partly in the forensic tools used to analyze mobile instant messaging, which have low reliability in their results, and the dynamic nature of the linguistic expressions used by the suspects. This work proposes a methodology for automatic identification of messages of police interest using techniques of Natural Language Processing (PLN), specifically Semantic Role Labeling (SRL). The methodology is based on the semantics of frames that defines linguistic situations and the semantic roles involved. For example, it is possible to identify not only that a message contains terms that indicate a crime (drug trafficking) but also the elements involved in the crime (such as the drug marketed, the place of sale, the amounts involved etc.). Another contribution of the work was the definition of a database of forensic semantic frames - FrameFor.BR, generated from FrameNet. Experimental evaluations of the system and the FrameFor.BR base evidenced an increase in coverage in relation to the current approaches used by forensic experts, contributing to improve reliability and reduce the time required for compiling computer expert reports.
Keywords: Computer forensic, FrameNet, natural language processing, mobile devices. === O trabalho pericial é de extrema relevância para investigação policial e importante prova material durante a etapa de processo penal. A perícia de computação envolve, principalmente, a extração e análise de dados de dispositivos móveis do tipo smartphones que são apreendidos em locais de crime ou em operações de busca e apreensão. Os institutos de perícias, porém, não conseguem atender à demanda devido à crescente quantidade de solicitações e ao volume de dados e textos para analisar. O problema está, em parte, nas ferramentas forenses utilizadas para análise de mensagens instantâneas de dispositivos móveis, as quais apresentam baixa confiabilidade em seus resultados, além do caráter dinâmico das expressões linguísticas utilizadas pelos suspeitos, sendo necessária a completa leitura do material analisado, pelos peritos. Esse trabalho propõe uma metodologia para identificação automática de mensagens de interesse policial através do uso de técnicas de Processamento de Linguagem Natural (PLN), especificamente de anotação de papeis semânticos (em inglês, Semantic Role Labeling - SRL). A metodologia é baseada na semântica de frames que define situações linguísticas e os papéis semânticos envolvidos. Por exemplo, é possível identificar não somente que uma mensagem contém termos que indiciam um crime (tráfico de drogas) mas também os elementos envolvidos no crime (como a droga comercializada, local da venda, valores envolvidos etc). Outra contribuição do trabalho, foi a definição de uma base de frames semânticos forenses - FrameFor.BR, gerada a partir da FrameNet. Avaliações experimentais do sistema e da base FrameFor.BR evidenciaram um aumento na cobertura em relação as atuais abordagens utilizadas pelos peritos forenses, contribuindo para melhoria da confiabilidade e na redução do tempo necessário para elaboração de laudos periciais de informática.
Palavras-chave: Computação forense, FrameNet, processamento de linguagem natural, dispositivos móveis. |
author2 |
Pinheiro, Vladia Celia Monteiro |
author_facet |
Pinheiro, Vladia Celia Monteiro Barreira, Ravi Veloso |
author |
Barreira, Ravi Veloso |
author_sort |
Barreira, Ravi Veloso |
title |
Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
title_short |
Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
title_full |
Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
title_fullStr |
Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
title_full_unstemmed |
Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
title_sort |
anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames |
publisher |
Universidade de Fortaleza |
publishDate |
2016 |
url |
https://uol.unifor.br/oul/ObraBdtdSiteTrazer.do?method=trazer&ns=true&obraCodigo=100611 http://dspace.unifor.br/handle/tede/100611 |
work_keys_str_mv |
AT barreiraraviveloso anotacaodepapeissemanticosemtextosparaapoiarainvestigacaopolicialutilizandosemanticadeframes AT barreiraraviveloso semanticrolelabellingintextstosupportpoliceinvestigationusingsemanticframesingles |
_version_ |
1719008945043931136 |
spelling |
ndltd-IBICT-oai-dspace.unifor.br-tede-1006112019-04-02T07:40:38Z Anotação de papéis semânticos em textos para apoiar a investigação policial utilizando semântica de frames SEMANTIC ROLE LABELLING IN TEXTS TO SUPPORT POLICE INVESTIGATION USING SEMANTIC FRAMES (Inglês) Barreira, Ravi Veloso Pinheiro, Vladia Celia Monteiro Furtado, João José Vasco Peixoto Furtado, João José Vasco Peixoto Mendes, Marília Soares Vasconcelos Filho, José Eurico de Pinheiro, Vladia Celia Monteiro Semântica de programação Linguagem de programação Perícia judicial Made available in DSpace on 2019-03-30T00:01:50Z (GMT). No. of bitstreams: 0 Previous issue date: 2016-12-22 The forensic work is of extreme relevance for police investigation and important material evidence during the stage of criminal trial. Computer science forensic work mainly involves extracting and analyzing data from smartphone-type mobile devices that are seized at crime scenes or in search and seizure operations. The Forensic Departments, however, can not meet the demand due to the growing number of requests and the volume of data and texts to analyze. The problem lies partly in the forensic tools used to analyze mobile instant messaging, which have low reliability in their results, and the dynamic nature of the linguistic expressions used by the suspects. This work proposes a methodology for automatic identification of messages of police interest using techniques of Natural Language Processing (PLN), specifically Semantic Role Labeling (SRL). The methodology is based on the semantics of frames that defines linguistic situations and the semantic roles involved. For example, it is possible to identify not only that a message contains terms that indicate a crime (drug trafficking) but also the elements involved in the crime (such as the drug marketed, the place of sale, the amounts involved etc.). Another contribution of the work was the definition of a database of forensic semantic frames - FrameFor.BR, generated from FrameNet. Experimental evaluations of the system and the FrameFor.BR base evidenced an increase in coverage in relation to the current approaches used by forensic experts, contributing to improve reliability and reduce the time required for compiling computer expert reports. Keywords: Computer forensic, FrameNet, natural language processing, mobile devices. O trabalho pericial é de extrema relevância para investigação policial e importante prova material durante a etapa de processo penal. A perícia de computação envolve, principalmente, a extração e análise de dados de dispositivos móveis do tipo smartphones que são apreendidos em locais de crime ou em operações de busca e apreensão. Os institutos de perícias, porém, não conseguem atender à demanda devido à crescente quantidade de solicitações e ao volume de dados e textos para analisar. O problema está, em parte, nas ferramentas forenses utilizadas para análise de mensagens instantâneas de dispositivos móveis, as quais apresentam baixa confiabilidade em seus resultados, além do caráter dinâmico das expressões linguísticas utilizadas pelos suspeitos, sendo necessária a completa leitura do material analisado, pelos peritos. Esse trabalho propõe uma metodologia para identificação automática de mensagens de interesse policial através do uso de técnicas de Processamento de Linguagem Natural (PLN), especificamente de anotação de papeis semânticos (em inglês, Semantic Role Labeling - SRL). A metodologia é baseada na semântica de frames que define situações linguísticas e os papéis semânticos envolvidos. Por exemplo, é possível identificar não somente que uma mensagem contém termos que indiciam um crime (tráfico de drogas) mas também os elementos envolvidos no crime (como a droga comercializada, local da venda, valores envolvidos etc). Outra contribuição do trabalho, foi a definição de uma base de frames semânticos forenses - FrameFor.BR, gerada a partir da FrameNet. Avaliações experimentais do sistema e da base FrameFor.BR evidenciaram um aumento na cobertura em relação as atuais abordagens utilizadas pelos peritos forenses, contribuindo para melhoria da confiabilidade e na redução do tempo necessário para elaboração de laudos periciais de informática. Palavras-chave: Computação forense, FrameNet, processamento de linguagem natural, dispositivos móveis. 2016-12-22 2019-03-30T00:01:50Z 2016-12-22 info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis https://uol.unifor.br/oul/ObraBdtdSiteTrazer.do?method=trazer&ns=true&obraCodigo=100611 http://dspace.unifor.br/handle/tede/100611 por 5443571202788449035 500 500 -7645770940771915222 info:eu-repo/semantics/openAccess Universidade de Fortaleza Mestrado Em Informática Aplicada UNIFOR Brasil Centro de Ciências Tecnológicas reponame:Biblioteca Digital de Teses e Dissertações da UNIFOR instname:Universidade de Fortaleza instacron:UNIFOR |