Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
Orientadores: Ariadne Maria Brito Rizzoni Carvalho, Anderson de Rezende Rocha === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica === Made available in DSpace on 2018-08-26T21:23:31Z (GMT). No. of bitstreams: 1 Cavalcante_Thiago...
Main Author: | |
---|---|
Other Authors: | |
Format: | Others |
Published: |
[s.n.]
2014
|
Subjects: | |
Online Access: | CAVALCANTE, Thiago. Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens. 2014. 55 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275539>. Acesso em: 26 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/275539 |
id |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-275539 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-2755392019-01-21T21:29:36Z Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens Atribuição de autoria em micro-mensagens Cavalcante, Thiago, 1989- UNIVERSIDADE ESTADUAL DE CAMPINAS Rocha, Anderson de Rezende, 1980- Carvalho, Ariadne Maria Brito Rizzoni, 1958- Pedrini, Hélio Freitas, Cinthia Obladen de Almendra Autoria Redes sociais Blogs Big data Internet Comunicação na tecnologia Authorship Social networks Blogs Big data Internet Communication in technology Orientadores: Ariadne Maria Brito Rizzoni Carvalho, Anderson de Rezende Rocha Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica Made available in DSpace on 2018-08-26T21:23:31Z (GMT). No. of bitstreams: 1 Cavalcante_Thiago_M.pdf: 3493838 bytes, checksum: 369bd6608e7326d0a998b426a1c7455b (MD5) Previous issue date: 2014 Resumo: Com o crescimento continuo do uso de midias sociais, a atribuição de autoria tem um papel imortante na prevenção dos crimes cibernéticos e na análise de rastros online deixados por assediadores, \textit{bullies}, ladrões de identidade entre outros. Nesta dissertação, nós propusemos um método para atribuição de autoria que é de cem a mil vezes mais rápido que o estado da arte. Nós também obtivemos uma acurácia 65\% na classificação de 50 autores. O método proposto se baseia numa representação de caracteristicas escalável utilizando os padrões das mensagens dos micro-blogs, e também nos utilizamos de um classificador de padrões customizado para lidar com grandes quantidades de dados e alta dimensionalidade. Por fim, nós discutimos a redução do espaço de busca na análise de centenas de suspeitos online e milões de micro mensagens online, o que torna essa abordagem valiosa para forense digital e aplicação das leis Abstract: With the ever-growing use of social media, authorship attribution plays an important role in avoiding cybercrime, and helping the analysis of online trails left behind by cyber pranks, stalkers, bullies, identity thieves and alike. In this dissertation, we propose a method for authorship attribution in micro blogs with efficiency one hundred to a thousand times faster than state-of-the-art counterparts. We also achieved a accuracy of 65% when classifying texts from 50 authors. The method relies on a powerful and scalable feature representation approach taking advantage of user patterns on micro-blog messages, and also on a custom-tailored pattern classifier adapted to deal with big data and high-dimensional data. Finally, we discuss search space reduction when analysing hundreds of online suspects and millions of online micro messages, which makes this approach invaluable for digital forensics and law enforcement Mestrado Ciência da Computação Mestre em Ciência da Computação 2014 2018-08-26T21:23:31Z 2018-08-26T21:23:31Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis CAVALCANTE, Thiago. Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens. 2014. 55 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275539>. Acesso em: 26 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/275539 info:eu-repo/semantics/openAccess 55 f. : il. application/octet-stream [s.n.] Universidade Estadual de Campinas. Instituto de Computação Programa de Pós-Gradução em Ciência da Computação reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP |
collection |
NDLTD |
format |
Others
|
sources |
NDLTD |
topic |
Autoria Redes sociais Blogs Big data Internet Comunicação na tecnologia Authorship Social networks Blogs Big data Internet Communication in technology |
spellingShingle |
Autoria Redes sociais Blogs Big data Internet Comunicação na tecnologia Authorship Social networks Blogs Big data Internet Communication in technology Cavalcante, Thiago, 1989- Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens |
description |
Orientadores: Ariadne Maria Brito Rizzoni Carvalho, Anderson de Rezende Rocha === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica === Made available in DSpace on 2018-08-26T21:23:31Z (GMT). No. of bitstreams: 1
Cavalcante_Thiago_M.pdf: 3493838 bytes, checksum: 369bd6608e7326d0a998b426a1c7455b (MD5)
Previous issue date: 2014 === Resumo: Com o crescimento continuo do uso de midias sociais, a atribuição de autoria tem um papel imortante na prevenção dos crimes cibernéticos e na análise de rastros online deixados por assediadores, \textit{bullies}, ladrões de identidade entre outros. Nesta dissertação, nós propusemos um método para atribuição de autoria que é de cem a mil vezes mais rápido que o estado da arte. Nós também obtivemos uma acurácia 65\% na classificação de 50 autores. O método proposto se baseia numa representação de caracteristicas escalável utilizando os padrões das mensagens dos micro-blogs, e também nos utilizamos de um classificador de padrões customizado para lidar com grandes quantidades de dados e alta dimensionalidade. Por fim, nós discutimos a redução do espaço de busca na análise de centenas de suspeitos online e milões de micro mensagens online, o que torna essa abordagem valiosa para forense digital e aplicação das leis === Abstract: With the ever-growing use of social media, authorship attribution plays an important role in avoiding cybercrime, and helping the analysis of online trails left behind by cyber pranks, stalkers, bullies, identity thieves and alike. In this dissertation, we propose a method for authorship attribution in micro blogs with efficiency one hundred to a thousand times faster than state-of-the-art counterparts. We also achieved a accuracy of 65% when classifying texts from 50 authors. The method relies on a powerful and scalable feature representation approach taking advantage of user patterns on micro-blog messages, and also on a custom-tailored pattern classifier adapted to deal with big data and high-dimensional data. Finally, we discuss search space reduction when analysing hundreds of online suspects and millions of online micro messages, which makes this approach invaluable for digital forensics and law enforcement === Mestrado === Ciência da Computação === Mestre em Ciência da Computação |
author2 |
UNIVERSIDADE ESTADUAL DE CAMPINAS |
author_facet |
UNIVERSIDADE ESTADUAL DE CAMPINAS Cavalcante, Thiago, 1989- |
author |
Cavalcante, Thiago, 1989- |
author_sort |
Cavalcante, Thiago, 1989- |
title |
Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens |
title_short |
Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens |
title_full |
Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens |
title_fullStr |
Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens |
title_full_unstemmed |
Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens |
title_sort |
authorship attribution on micro-messages = atribuição de autoria em micro-mensagens |
publisher |
[s.n.] |
publishDate |
2014 |
url |
CAVALCANTE, Thiago. Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens. 2014. 55 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275539>. Acesso em: 26 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/275539 |
work_keys_str_mv |
AT cavalcantethiago1989 authorshipattributiononmicromessagesatribuicaodeautoriaemmicromensagens AT cavalcantethiago1989 atribuicaodeautoriaemmicromensagens |
_version_ |
1718884703611650048 |