Finding seminal scientific publications with graph mining
We investigate the applicability of network analysis to the problem of finding seminal publications in scientific publishing. In particular, we focus on the network measures betweenness centrality, the so-called backbone graph, and the burstiness of citations. The metrics are evaluated using precisi...
Main Author: | |
---|---|
Format: | Others |
Language: | English |
Published: |
KTH, Skolan för datavetenskap och kommunikation (CSC)
2015
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-172382 |
id |
ndltd-UPSALLA1-oai-DiVA.org-kth-172382 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-kth-1723822018-01-12T05:10:39ZFinding seminal scientific publications with graph miningengAnvändning av grafanalys för att hitta betydelsefulla vetenskapliga artiklarRunelöv, MartinKTH, Skolan för datavetenskap och kommunikation (CSC)2015citation networkgraph miningnetworkseminalcentralityComputer SciencesDatavetenskap (datalogi)We investigate the applicability of network analysis to the problem of finding seminal publications in scientific publishing. In particular, we focus on the network measures betweenness centrality, the so-called backbone graph, and the burstiness of citations. The metrics are evaluated using precision-related scores with respect to gold standards based on fellow programmes and manual annotation. Citation counts, PageRank, and random selection are used as baselines. We find that the backbone graph provides us with a way to possibly discover seminal publications with low citation count, and combining betweenness and burstiness gives results on par with citation count. I detta examensarbete undersöks det huruvida analys av citeringsgrafer kan användas för att finna betydelsefulla vetenskapliga publikationer. Framför allt studeras ”betweenness”-centralitet, den så kallade ”backbone”-grafen samt ”burstiness” av citeringar. Dessa mått utvärderas med hjälp av precisionsmått med avseende på guldstandarder baserade på ’fellow’-program samt via manuell annotering. Antal citeringar, PageRank, och slumpmässigt urval används som jämförelse. Resultaten visar att ”backbone”-grafen kan bidra till att eventuellt upptäcka betydelsefulla publikationer med ett lågt antal citeringar samt att en kombination av ”betweenness” och ”burstiness” ger resultat i nivå med de man får av att räkna antal citeringar. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-172382application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
English |
format |
Others
|
sources |
NDLTD |
topic |
citation network graph mining network seminal centrality Computer Sciences Datavetenskap (datalogi) |
spellingShingle |
citation network graph mining network seminal centrality Computer Sciences Datavetenskap (datalogi) Runelöv, Martin Finding seminal scientific publications with graph mining |
description |
We investigate the applicability of network analysis to the problem of finding seminal publications in scientific publishing. In particular, we focus on the network measures betweenness centrality, the so-called backbone graph, and the burstiness of citations. The metrics are evaluated using precision-related scores with respect to gold standards based on fellow programmes and manual annotation. Citation counts, PageRank, and random selection are used as baselines. We find that the backbone graph provides us with a way to possibly discover seminal publications with low citation count, and combining betweenness and burstiness gives results on par with citation count. === I detta examensarbete undersöks det huruvida analys av citeringsgrafer kan användas för att finna betydelsefulla vetenskapliga publikationer. Framför allt studeras ”betweenness”-centralitet, den så kallade ”backbone”-grafen samt ”burstiness” av citeringar. Dessa mått utvärderas med hjälp av precisionsmått med avseende på guldstandarder baserade på ’fellow’-program samt via manuell annotering. Antal citeringar, PageRank, och slumpmässigt urval används som jämförelse. Resultaten visar att ”backbone”-grafen kan bidra till att eventuellt upptäcka betydelsefulla publikationer med ett lågt antal citeringar samt att en kombination av ”betweenness” och ”burstiness” ger resultat i nivå med de man får av att räkna antal citeringar. |
author |
Runelöv, Martin |
author_facet |
Runelöv, Martin |
author_sort |
Runelöv, Martin |
title |
Finding seminal scientific publications with graph mining |
title_short |
Finding seminal scientific publications with graph mining |
title_full |
Finding seminal scientific publications with graph mining |
title_fullStr |
Finding seminal scientific publications with graph mining |
title_full_unstemmed |
Finding seminal scientific publications with graph mining |
title_sort |
finding seminal scientific publications with graph mining |
publisher |
KTH, Skolan för datavetenskap och kommunikation (CSC) |
publishDate |
2015 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-172382 |
work_keys_str_mv |
AT runelovmartin findingseminalscientificpublicationswithgraphmining AT runelovmartin anvandningavgrafanalysforatthittabetydelsefullavetenskapligaartiklar |
_version_ |
1718605534388551680 |