Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion
Denna rapport syftar till att undersöka om ämnesmodellering och klustring kan användas till eller underlätta arbetet med trolldetektering. De två ämnesmodellerna Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) används samt klustringsmetoden K-means. En grupp om tio användare som...
Main Authors: | , |
---|---|
Format: | Others |
Language: | Swedish |
Published: |
KTH, Skolan för datavetenskap och kommunikation (CSC)
2016
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186430 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-186430 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-1864302018-01-11T05:12:09ZTrolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektionsweTroll DetectionSöderberg, ErikDu, LiliKTH, Skolan för datavetenskap och kommunikation (CSC)KTH, Skolan för datavetenskap och kommunikation (CSC)2016Computer SciencesDatavetenskap (datalogi)Denna rapport syftar till att undersöka om ämnesmodellering och klustring kan användas till eller underlätta arbetet med trolldetektering. De två ämnesmodellerna Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) används samt klustringsmetoden K-means. En grupp om tio användare som bedöms som troll undersöks följt av en undersökning av tio liknande användare för vart och en av de tio trollen. Resultatet visar på att en relativt god mängd av av de relaterade användarna också kunde bedömas som troll. Klustringen kunde också avslöja en del mindre grupper varav några bestod av bottar. Slutsatsen som dras är att ämnesmodellering och klustring tycks vara en god väg att gå men att ytterligare studier behövs. This report aims to investigate if topic modeling and clustering can be used for or ease the work with troll detection. The two topic models Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) as well as the clustering algorithm K-means are selected for this investigation. For each model, each troll in a group of ten trolls has ten related users extracted and then judged on whether they are trolls or not. The results show that a relatively large amount of the related users also were judged as likely to be trolls. The clustering revealed a couple of small groups which seem to consist of a small network of bots. The drawn conclusion is that topic modeling and clustering are seemingly a good choice for aiding in the detection of trolls but further studies are required. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186430application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
Swedish |
format |
Others
|
sources |
NDLTD |
topic |
Computer Sciences Datavetenskap (datalogi) |
spellingShingle |
Computer Sciences Datavetenskap (datalogi) Söderberg, Erik Du, Lili Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
description |
Denna rapport syftar till att undersöka om ämnesmodellering och klustring kan användas till eller underlätta arbetet med trolldetektering. De två ämnesmodellerna Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) används samt klustringsmetoden K-means. En grupp om tio användare som bedöms som troll undersöks följt av en undersökning av tio liknande användare för vart och en av de tio trollen. Resultatet visar på att en relativt god mängd av av de relaterade användarna också kunde bedömas som troll. Klustringen kunde också avslöja en del mindre grupper varav några bestod av bottar. Slutsatsen som dras är att ämnesmodellering och klustring tycks vara en god väg att gå men att ytterligare studier behövs. === This report aims to investigate if topic modeling and clustering can be used for or ease the work with troll detection. The two topic models Latent Semantic Indexing (LSI) och Latent Dirichlet Allocation (LDA) as well as the clustering algorithm K-means are selected for this investigation. For each model, each troll in a group of ten trolls has ten related users extracted and then judged on whether they are trolls or not. The results show that a relatively large amount of the related users also were judged as likely to be trolls. The clustering revealed a couple of small groups which seem to consist of a small network of bots. The drawn conclusion is that topic modeling and clustering are seemingly a good choice for aiding in the detection of trolls but further studies are required. |
author |
Söderberg, Erik Du, Lili |
author_facet |
Söderberg, Erik Du, Lili |
author_sort |
Söderberg, Erik |
title |
Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
title_short |
Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
title_full |
Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
title_fullStr |
Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
title_full_unstemmed |
Trolldetektering : En undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
title_sort |
trolldetektering : en undersökning i lämpligheten att använda ämnesmodellering och klustring för trolldetektion |
publisher |
KTH, Skolan för datavetenskap och kommunikation (CSC) |
publishDate |
2016 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186430 |
work_keys_str_mv |
AT soderbergerik trolldetekteringenundersokningilamplighetenattanvandaamnesmodelleringochklustringfortrolldetektion AT dulili trolldetekteringenundersokningilamplighetenattanvandaamnesmodelleringochklustringfortrolldetektion AT soderbergerik trolldetection AT dulili trolldetection |
_version_ |
1718604305631543296 |