Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion

Denna rapport syftar till att undersöka om ämnesmodellering och klustring kan användas till eller underlätta arbetet med trolldetektering. De två ämnesmodellerna Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) används samt klustringsmetoden K-means. En grupp om tio användare som...

Full description

Bibliographic Details
Main Authors: Söderberg, Erik, Du, Lili
Format: Others
Language:Swedish
Published: KTH, Skolan för datavetenskap och kommunikation (CSC) 2016
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186430
id ndltd-UPSALLA1-oai-DiVA.org-kth-186430
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-1864302018-01-11T05:12:09ZTrolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektionsweTroll DetectionSöderberg, ErikDu, LiliKTH, Skolan för datavetenskap och kommunikation (CSC)KTH, Skolan för datavetenskap och kommunikation (CSC)2016Computer SciencesDatavetenskap (datalogi)Denna rapport syftar till att undersöka om ämnesmodellering och klustring kan användas till eller underlätta arbetet med trolldetektering. De två ämnesmodellerna Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) används samt klustringsmetoden K-means. En grupp om tio användare som bedöms som troll undersöks följt av en undersökning av tio liknande användare för vart och en av de tio trollen. Resultatet visar på att en relativt god mängd av av de relaterade användarna också kunde bedömas som troll. Klustringen kunde också avslöja en del mindre grupper varav några bestod av bottar. Slutsatsen som dras är att ämnesmodellering och klustring tycks vara en god väg att gå men att ytterligare studier behövs. This report aims to investigate if topic modeling and clustering can be used for or ease the work with troll detection. The two topic models Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) as well as the clustering algorithm K-means are selected for this investigation. For each model, each troll in a group of ten trolls has ten related users extracted and then judged on whether they are trolls or not. The results show that a relatively large amount of the related users also were judged as likely to be trolls. The clustering revealed a couple of small groups which seem to consist of a small network of bots. The drawn conclusion is that topic modeling and clustering are seemingly a good choice for aiding in the detection of trolls but further studies are required. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186430application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language Swedish
format Others
sources NDLTD
topic Computer Sciences
Datavetenskap (datalogi)
spellingShingle Computer Sciences
Datavetenskap (datalogi)
Söderberg, Erik
Du, Lili
Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
description Denna rapport syftar till att undersöka om ämnesmodellering och klustring kan användas till eller underlätta arbetet med trolldetektering. De två ämnesmodellerna Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) används samt klustringsmetoden K-means. En grupp om tio användare som bedöms som troll undersöks följt av en undersökning av tio liknande användare för vart och en av de tio trollen. Resultatet visar på att en relativt god mängd av av de relaterade användarna också kunde bedömas som troll. Klustringen kunde också avslöja en del mindre grupper varav några bestod av bottar. Slutsatsen som dras är att ämnesmodellering och klustring tycks vara en god väg att gå men att ytterligare studier behövs. === This report aims to investigate if topic modeling and clustering can be used for or ease the work with troll detection. The two topic models Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) as well as the clustering algorithm K-means are selected for this investigation. For each model, each troll in a group of ten trolls has ten related users extracted and then judged on whether they are trolls or not. The results show that a relatively large amount of the related users also were judged as likely to be trolls. The clustering revealed a couple of small groups which seem to consist of a small network of bots. The drawn conclusion is that topic modeling and clustering are seemingly a good choice for aiding in the detection of trolls but further studies are required.
author Söderberg, Erik
Du, Lili
author_facet Söderberg, Erik
Du, Lili
author_sort Söderberg, Erik
title Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
title_short Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
title_full Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
title_fullStr Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
title_full_unstemmed Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
title_sort trolldetektering : en undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
publisher KTH, Skolan för datavetenskap och kommunikation (CSC)
publishDate 2016
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186430
work_keys_str_mv AT soderbergerik trolldetekteringenundersokningilamplighetenattanvandaamnesmodelleringochklustringfortrolldetektion
AT dulili trolldetekteringenundersokningilamplighetenattanvandaamnesmodelleringochklustringfortrolldetektion
AT soderbergerik trolldetection
AT dulili trolldetection
_version_ 1718604305631543296