A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content

This thesis evaluates and compares two different clustering strategies for clustering users in Sweden’s political Twittersphere: clustering based on tweet content and clustering based on social interactions data. Users were detected by filtering a stream of tweets filtered on a list of politically c...

Full description

Bibliographic Details
Main Author: Vakili, Thomas
Format: Others
Language:English
Published: KTH, Skolan för datavetenskap och kommunikation (CSC) 2016
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186469
id ndltd-UPSALLA1-oai-DiVA.org-kth-186469
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-1864692018-01-11T05:12:09ZA Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet ContentengEn jämförelse mellan att klustra den svenska poltiska twittersfären baserat på innehåll och på sociala interaktionerVakili, ThomasKTH, Skolan för datavetenskap och kommunikation (CSC)2016Computer SciencesDatavetenskap (datalogi)This thesis evaluates and compares two different clustering strategies for clustering users in Sweden’s political Twittersphere: clustering based on tweet content and clustering based on social interactions data. Users were detected by filtering a stream of tweets filtered on a list of politically charged keywords. The top 10 % of the detected users with the most followers were selected and their social interactions data as well 2,000 of their latest tweets were downloaded. The gathered data was used to construct one similarity matrix for each of the strategies studied. Spectral clustering of the matrices was performed to form two separate sets of clusters, one based on tweet content and one based on social interactions. After analyzing the two cluster sets manually, we find that the content based clustering is biased towards topic based clusters while clustering based on social interactions is more effective in finding clusters centered around ideology and political partisanship. Denna uppsats utvärderar och jämför två olika strategier för att klustra användare i Sveriges politiska twittersfär: klustring baserat på tweet-innehåll och klustring baserat på sociala interaktioner. Användare upptäcktes genom att filtrera en ström av tweets med hjälp av en lista med politiskt laddade nyckelord. De 10 % av användarna med högst antal följare valdes ut och information om deras sociala interaktioner samt deras 2 000 senaste tweets laddades ner. Denna data användes för att konstruera en likhetsmatris för varje studerad klustringsstrategi. Spektral klustring av matriserna utfördes för att bilda två uppsättningar kluster, en för varje strategi. Efter manuell analys av klustren drogs slutsatsen att innehållsbaserad klustring tenderar att ge genrebaserade kluster medan klustring baserat på sociala interaktioner tenderar att ge kluster som i högre utsträckning cirkulerar kring ideologisk inriktning och politisk partitillhörighet. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186469application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Computer Sciences
Datavetenskap (datalogi)
spellingShingle Computer Sciences
Datavetenskap (datalogi)
Vakili, Thomas
A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content
description This thesis evaluates and compares two different clustering strategies for clustering users in Sweden’s political Twittersphere: clustering based on tweet content and clustering based on social interactions data. Users were detected by filtering a stream of tweets filtered on a list of politically charged keywords. The top 10 % of the detected users with the most followers were selected and their social interactions data as well 2,000 of their latest tweets were downloaded. The gathered data was used to construct one similarity matrix for each of the strategies studied. Spectral clustering of the matrices was performed to form two separate sets of clusters, one based on tweet content and one based on social interactions. After analyzing the two cluster sets manually, we find that the content based clustering is biased towards topic based clusters while clustering based on social interactions is more effective in finding clusters centered around ideology and political partisanship. === Denna uppsats utvärderar och jämför två olika strategier för att klustra användare i Sveriges politiska twittersfär: klustring baserat på tweet-innehåll och klustring baserat på sociala interaktioner. Användare upptäcktes genom att filtrera en ström av tweets med hjälp av en lista med politiskt laddade nyckelord. De 10 % av användarna med högst antal följare valdes ut och information om deras sociala interaktioner samt deras 2 000 senaste tweets laddades ner. Denna data användes för att konstruera en likhetsmatris för varje studerad klustringsstrategi. Spektral klustring av matriserna utfördes för att bilda två uppsättningar kluster, en för varje strategi. Efter manuell analys av klustren drogs slutsatsen att innehållsbaserad klustring tenderar att ge genrebaserade kluster medan klustring baserat på sociala interaktioner tenderar att ge kluster som i högre utsträckning cirkulerar kring ideologisk inriktning och politisk partitillhörighet.
author Vakili, Thomas
author_facet Vakili, Thomas
author_sort Vakili, Thomas
title A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content
title_short A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content
title_full A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content
title_fullStr A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content
title_full_unstemmed A Comparison of Clustering the Swedish Political Twittersphere Based on Social Interactions and on Tweet Content
title_sort comparison of clustering the swedish political twittersphere based on social interactions and on tweet content
publisher KTH, Skolan för datavetenskap och kommunikation (CSC)
publishDate 2016
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-186469
work_keys_str_mv AT vakilithomas acomparisonofclusteringtheswedishpoliticaltwitterspherebasedonsocialinteractionsandontweetcontent
AT vakilithomas enjamforelsemellanattklustradensvenskapoltiskatwittersfarenbaseratpainnehallochpasocialainteraktioner
AT vakilithomas comparisonofclusteringtheswedishpoliticaltwitterspherebasedonsocialinteractionsandontweetcontent
_version_ 1718604313871253504