Predicting Influencer Actual Reach Using Linear Regression

The influencer marketing industry has seen a tremendous growth in recent years, yet the effectiveness of this marketing form is still largely unexplored. This report aims to explore how various performance measures are linked to the reach of social media pages, utilizing the linear regression model....

Full description

Bibliographic Details
Main Authors: Khogasteh, Sam, Wiorek, Edvin
Format: Others
Language:English
Published: KTH, Skolan för elektroteknik och datavetenskap (EECS) 2021
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299339
id ndltd-UPSALLA1-oai-DiVA.org-kth-299339
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-2993392021-08-12T05:24:08ZPredicting Influencer Actual Reach Using Linear RegressionengKhogasteh, SamWiorek, EdvinKTH, Skolan för elektroteknik och datavetenskap (EECS)2021Other Computer and Information ScienceAnnan data- och informationsvetenskapThe influencer marketing industry has seen a tremendous growth in recent years, yet the effectiveness of this marketing form is still largely unexplored. This report aims to explore how various performance measures are linked to the reach of social media pages, utilizing the linear regression model. Three different data sets were collected manually, or using web scraping. By splitting these data sets to training- and test data we examined the degree to which the linear regression model can predict the actual reach, the page views and the weekly growth of an influencer. We concluded that there is a statistically significant correlation between multiple performance metrics of a social media page and the actual reach or the page views of that account. This study is however limited by its narrow data set and time frame, warranting future research in order to further establish the degree of this correlation. The results of this study can benefit companies in their process of selecting influencers to collaborate with, as well as determining the expected return on investment for that particular collaboration. This can in turn lead to a more efficient, authentic and transparent marketplace, and to consumers being less exposed to advertisement from misleading and malicious influencers.  Under de senaste åren har marknadsföringsindustrin med influencers växt drastiskt, ändå är effektiviteten hos denna marknadsföringsform relativt outforskad. Denna rapport avser använda linjär regression för att utforska hur olika prestationsmått är kopplade till räckvidden hos profiler på sociala medier. De olika datamängderna samlades manuellt, eller med hjälp av web scraping. Genom att dela upp datamängderna i träningsdata och testdata undersökte vi i hur hög grad den linjära regressionsmodellen kan förutsäga faktisk räckvidd, sidvisningar och profilens tillväxt under en vecka.  Vi drog slutsatsen att det finns en statistisk signifikant korrelation mellan flera prestationsmått för en profilsida, och antalet sidvisningar for det kontot. Studien är emellertid begränsad av sin datamängd och tidsspann, något som motiverar framtida studier for att ytterligare etablera korrelationsgraden.  Studiens resultat kan gynna företag i deras process att välja vilka influencers de vill samarbeta med, såväl som i deras process att bestämma den förväntade avkastningen för ett specifikt samarbete. Detta kan i sin tur bidra till en mer effektiv, autentisk och transparent marknad, något som också gör att konsumenten ¨ blir mindre exponerad for marknadsföring från vilseledande och illvilliga influencers. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299339TRITA-EECS-EX ; 2021:354application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic Other Computer and Information Science
Annan data- och informationsvetenskap
spellingShingle Other Computer and Information Science
Annan data- och informationsvetenskap
Khogasteh, Sam
Wiorek, Edvin
Predicting Influencer Actual Reach Using Linear Regression
description The influencer marketing industry has seen a tremendous growth in recent years, yet the effectiveness of this marketing form is still largely unexplored. This report aims to explore how various performance measures are linked to the reach of social media pages, utilizing the linear regression model. Three different data sets were collected manually, or using web scraping. By splitting these data sets to training- and test data we examined the degree to which the linear regression model can predict the actual reach, the page views and the weekly growth of an influencer. We concluded that there is a statistically significant correlation between multiple performance metrics of a social media page and the actual reach or the page views of that account. This study is however limited by its narrow data set and time frame, warranting future research in order to further establish the degree of this correlation. The results of this study can benefit companies in their process of selecting influencers to collaborate with, as well as determining the expected return on investment for that particular collaboration. This can in turn lead to a more efficient, authentic and transparent marketplace, and to consumers being less exposed to advertisement from misleading and malicious influencers.  === Under de senaste åren har marknadsföringsindustrin med influencers växt drastiskt, ändå är effektiviteten hos denna marknadsföringsform relativt outforskad. Denna rapport avser använda linjär regression för att utforska hur olika prestationsmått är kopplade till räckvidden hos profiler på sociala medier. De olika datamängderna samlades manuellt, eller med hjälp av web scraping. Genom att dela upp datamängderna i träningsdata och testdata undersökte vi i hur hög grad den linjära regressionsmodellen kan förutsäga faktisk räckvidd, sidvisningar och profilens tillväxt under en vecka.  Vi drog slutsatsen att det finns en statistisk signifikant korrelation mellan flera prestationsmått för en profilsida, och antalet sidvisningar for det kontot. Studien är emellertid begränsad av sin datamängd och tidsspann, något som motiverar framtida studier for att ytterligare etablera korrelationsgraden.  Studiens resultat kan gynna företag i deras process att välja vilka influencers de vill samarbeta med, såväl som i deras process att bestämma den förväntade avkastningen för ett specifikt samarbete. Detta kan i sin tur bidra till en mer effektiv, autentisk och transparent marknad, något som också gör att konsumenten ¨ blir mindre exponerad for marknadsföring från vilseledande och illvilliga influencers.
author Khogasteh, Sam
Wiorek, Edvin
author_facet Khogasteh, Sam
Wiorek, Edvin
author_sort Khogasteh, Sam
title Predicting Influencer Actual Reach Using Linear Regression
title_short Predicting Influencer Actual Reach Using Linear Regression
title_full Predicting Influencer Actual Reach Using Linear Regression
title_fullStr Predicting Influencer Actual Reach Using Linear Regression
title_full_unstemmed Predicting Influencer Actual Reach Using Linear Regression
title_sort predicting influencer actual reach using linear regression
publisher KTH, Skolan för elektroteknik och datavetenskap (EECS)
publishDate 2021
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-299339
work_keys_str_mv AT khogastehsam predictinginfluenceractualreachusinglinearregression
AT wiorekedvin predictinginfluenceractualreachusinglinearregression
_version_ 1719459681471037440