Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens

Orientadores: Ariadne Maria Brito Rizzoni Carvalho, Anderson de Rezende Rocha === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica === Made available in DSpace on 2018-08-26T21:23:31Z (GMT). No. of bitstreams: 1 Cavalcante_Thiago...

Full description

Bibliographic Details
Main Author: Cavalcante, Thiago, 1989-
Other Authors: UNIVERSIDADE ESTADUAL DE CAMPINAS
Format: Others
Published: [s.n.] 2014
Subjects:
Online Access:CAVALCANTE, Thiago. Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens. 2014. 55 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275539>. Acesso em: 26 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/275539
id ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-275539
record_format oai_dc
spelling ndltd-IBICT-oai-repositorio.unicamp.br-REPOSIP-2755392019-01-21T21:29:36Z Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens Atribuição de autoria em micro-mensagens Cavalcante, Thiago, 1989- UNIVERSIDADE ESTADUAL DE CAMPINAS Rocha, Anderson de Rezende, 1980- Carvalho, Ariadne Maria Brito Rizzoni, 1958- Pedrini, Hélio Freitas, Cinthia Obladen de Almendra Autoria Redes sociais Blogs Big data Internet Comunicação na tecnologia Authorship Social networks Blogs Big data Internet Communication in technology Orientadores: Ariadne Maria Brito Rizzoni Carvalho, Anderson de Rezende Rocha Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica Made available in DSpace on 2018-08-26T21:23:31Z (GMT). No. of bitstreams: 1 Cavalcante_Thiago_M.pdf: 3493838 bytes, checksum: 369bd6608e7326d0a998b426a1c7455b (MD5) Previous issue date: 2014 Resumo: Com o crescimento continuo do uso de midias sociais, a atribuição de autoria tem um papel imortante na prevenção dos crimes cibernéticos e na análise de rastros online deixados por assediadores, \textit{bullies}, ladrões de identidade entre outros. Nesta dissertação, nós propusemos um método para atribuição de autoria que é de cem a mil vezes mais rápido que o estado da arte. Nós também obtivemos uma acurácia 65\% na classificação de 50 autores. O método proposto se baseia numa representação de caracteristicas escalável utilizando os padrões das mensagens dos micro-blogs, e também nos utilizamos de um classificador de padrões customizado para lidar com grandes quantidades de dados e alta dimensionalidade. Por fim, nós discutimos a redução do espaço de busca na análise de centenas de suspeitos online e milões de micro mensagens online, o que torna essa abordagem valiosa para forense digital e aplicação das leis Abstract: With the ever-growing use of social media, authorship attribution plays an important role in avoiding cybercrime, and helping the analysis of online trails left behind by cyber pranks, stalkers, bullies, identity thieves and alike. In this dissertation, we propose a method for authorship attribution in micro blogs with efficiency one hundred to a thousand times faster than state-of-the-art counterparts. We also achieved a accuracy of 65% when classifying texts from 50 authors. The method relies on a powerful and scalable feature representation approach taking advantage of user patterns on micro-blog messages, and also on a custom-tailored pattern classifier adapted to deal with big data and high-dimensional data. Finally, we discuss search space reduction when analysing hundreds of online suspects and millions of online micro messages, which makes this approach invaluable for digital forensics and law enforcement Mestrado Ciência da Computação Mestre em Ciência da Computação 2014 2018-08-26T21:23:31Z 2018-08-26T21:23:31Z info:eu-repo/semantics/publishedVersion info:eu-repo/semantics/masterThesis CAVALCANTE, Thiago. Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens. 2014. 55 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275539>. Acesso em: 26 ago. 2018. http://repositorio.unicamp.br/jspui/handle/REPOSIP/275539 info:eu-repo/semantics/openAccess 55 f. : il. application/octet-stream [s.n.] Universidade Estadual de Campinas. Instituto de Computação Programa de Pós-Gradução em Ciência da Computação reponame:Repositório Institucional da Unicamp instname:Universidade Estadual de Campinas instacron:UNICAMP
collection NDLTD
format Others
sources NDLTD
topic Autoria
Redes sociais
Blogs
Big data
Internet
Comunicação na tecnologia
Authorship
Social networks
Blogs
Big data
Internet
Communication in technology
spellingShingle Autoria
Redes sociais
Blogs
Big data
Internet
Comunicação na tecnologia
Authorship
Social networks
Blogs
Big data
Internet
Communication in technology
Cavalcante, Thiago, 1989-
Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
description Orientadores: Ariadne Maria Brito Rizzoni Carvalho, Anderson de Rezende Rocha === Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica === Made available in DSpace on 2018-08-26T21:23:31Z (GMT). No. of bitstreams: 1 Cavalcante_Thiago_M.pdf: 3493838 bytes, checksum: 369bd6608e7326d0a998b426a1c7455b (MD5) Previous issue date: 2014 === Resumo: Com o crescimento continuo do uso de midias sociais, a atribuição de autoria tem um papel imortante na prevenção dos crimes cibernéticos e na análise de rastros online deixados por assediadores, \textit{bullies}, ladrões de identidade entre outros. Nesta dissertação, nós propusemos um método para atribuição de autoria que é de cem a mil vezes mais rápido que o estado da arte. Nós também obtivemos uma acurácia 65\% na classificação de 50 autores. O método proposto se baseia numa representação de caracteristicas escalável utilizando os padrões das mensagens dos micro-blogs, e também nos utilizamos de um classificador de padrões customizado para lidar com grandes quantidades de dados e alta dimensionalidade. Por fim, nós discutimos a redução do espaço de busca na análise de centenas de suspeitos online e milões de micro mensagens online, o que torna essa abordagem valiosa para forense digital e aplicação das leis === Abstract: With the ever-growing use of social media, authorship attribution plays an important role in avoiding cybercrime, and helping the analysis of online trails left behind by cyber pranks, stalkers, bullies, identity thieves and alike. In this dissertation, we propose a method for authorship attribution in micro blogs with efficiency one hundred to a thousand times faster than state-of-the-art counterparts. We also achieved a accuracy of 65% when classifying texts from 50 authors. The method relies on a powerful and scalable feature representation approach taking advantage of user patterns on micro-blog messages, and also on a custom-tailored pattern classifier adapted to deal with big data and high-dimensional data. Finally, we discuss search space reduction when analysing hundreds of online suspects and millions of online micro messages, which makes this approach invaluable for digital forensics and law enforcement === Mestrado === Ciência da Computação === Mestre em Ciência da Computação
author2 UNIVERSIDADE ESTADUAL DE CAMPINAS
author_facet UNIVERSIDADE ESTADUAL DE CAMPINAS
Cavalcante, Thiago, 1989-
author Cavalcante, Thiago, 1989-
author_sort Cavalcante, Thiago, 1989-
title Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
title_short Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
title_full Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
title_fullStr Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
title_full_unstemmed Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens
title_sort authorship attribution on micro-messages = atribuição de autoria em micro-mensagens
publisher [s.n.]
publishDate 2014
url CAVALCANTE, Thiago. Authorship attribution on micro-messages = Atribuição de autoria em micro-mensagens. 2014. 55 f. Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática Estatística e Computação Científica, Campinas, SP. Disponível em: <http://www.repositorio.unicamp.br/handle/REPOSIP/275539>. Acesso em: 26 ago. 2018.
http://repositorio.unicamp.br/jspui/handle/REPOSIP/275539
work_keys_str_mv AT cavalcantethiago1989 authorshipattributiononmicromessagesatribuicaodeautoriaemmicromensagens
AT cavalcantethiago1989 atribuicaodeautoriaemmicromensagens
_version_ 1718884703611650048