Finding seminal scientific publications with graph mining

We investigate the applicability of network analysis to the problem of finding seminal publications in scientific publishing. In particular, we focus on the network measures betweenness centrality, the so-called backbone graph, and the burstiness of citations. The metrics are evaluated using precisi...

Full description

Bibliographic Details
Main Author: Runelöv, Martin
Format: Others
Language:English
Published: KTH, Skolan för datavetenskap och kommunikation (CSC) 2015
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-172382
id ndltd-UPSALLA1-oai-DiVA.org-kth-172382
record_format oai_dc
spelling ndltd-UPSALLA1-oai-DiVA.org-kth-1723822018-01-12T05:10:39ZFinding seminal scientific publications with graph miningengAnvändning av grafanalys för att hitta betydelsefulla vetenskapliga artiklarRunelöv, MartinKTH, Skolan för datavetenskap och kommunikation (CSC)2015citation networkgraph miningnetworkseminalcentralityComputer SciencesDatavetenskap (datalogi)We investigate the applicability of network analysis to the problem of finding seminal publications in scientific publishing. In particular, we focus on the network measures betweenness centrality, the so-called backbone graph, and the burstiness of citations. The metrics are evaluated using precision-related scores with respect to gold standards based on fellow programmes and manual annotation. Citation counts, PageRank, and random selection are used as baselines. We find that the backbone graph provides us with a way to possibly discover seminal publications with low citation count, and combining betweenness and burstiness gives results on par with citation count. I detta examensarbete undersöks det huruvida analys av citeringsgrafer kan användas för att finna betydelsefulla vetenskapliga publikationer. Framför allt studeras ”betweenness”-centralitet, den så kallade ”backbone”-grafen samt ”burstiness” av citeringar. Dessa mått utvärderas med hjälp av precisionsmått med avseende på guldstandarder baserade på ’fellow’-program samt via manuell annotering. Antal citeringar, PageRank, och slumpmässigt urval används som jämförelse. Resultaten visar att ”backbone”-grafen kan bidra till att eventuellt upptäcka betydelsefulla publikationer med ett lågt antal citeringar samt att en kombination av ”betweenness” och ”burstiness” ger resultat i nivå med de man får av att räkna antal citeringar. Student thesisinfo:eu-repo/semantics/bachelorThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-172382application/pdfinfo:eu-repo/semantics/openAccess
collection NDLTD
language English
format Others
sources NDLTD
topic citation network
graph mining
network
seminal
centrality
Computer Sciences
Datavetenskap (datalogi)
spellingShingle citation network
graph mining
network
seminal
centrality
Computer Sciences
Datavetenskap (datalogi)
Runelöv, Martin
Finding seminal scientific publications with graph mining
description We investigate the applicability of network analysis to the problem of finding seminal publications in scientific publishing. In particular, we focus on the network measures betweenness centrality, the so-called backbone graph, and the burstiness of citations. The metrics are evaluated using precision-related scores with respect to gold standards based on fellow programmes and manual annotation. Citation counts, PageRank, and random selection are used as baselines. We find that the backbone graph provides us with a way to possibly discover seminal publications with low citation count, and combining betweenness and burstiness gives results on par with citation count. === I detta examensarbete undersöks det huruvida analys av citeringsgrafer kan användas för att finna betydelsefulla vetenskapliga publikationer. Framför allt studeras ”betweenness”-centralitet, den så kallade ”backbone”-grafen samt ”burstiness” av citeringar. Dessa mått utvärderas med hjälp av precisionsmått med avseende på guldstandarder baserade på ’fellow’-program samt via manuell annotering. Antal citeringar, PageRank, och slumpmässigt urval används som jämförelse. Resultaten visar att ”backbone”-grafen kan bidra till att eventuellt upptäcka betydelsefulla publikationer med ett lågt antal citeringar samt att en kombination av ”betweenness” och ”burstiness” ger resultat i nivå med de man får av att räkna antal citeringar.
author Runelöv, Martin
author_facet Runelöv, Martin
author_sort Runelöv, Martin
title Finding seminal scientific publications with graph mining
title_short Finding seminal scientific publications with graph mining
title_full Finding seminal scientific publications with graph mining
title_fullStr Finding seminal scientific publications with graph mining
title_full_unstemmed Finding seminal scientific publications with graph mining
title_sort finding seminal scientific publications with graph mining
publisher KTH, Skolan för datavetenskap och kommunikation (CSC)
publishDate 2015
url http://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-172382
work_keys_str_mv AT runelovmartin findingseminalscientificpublicationswithgraphmining
AT runelovmartin anvandningavgrafanalysforatthittabetydelsefullavetenskapligaartiklar
_version_ 1718605534388551680