En tillämpning av riktad dataväxling : En metod för statistisk röjandekontroll

Vid framställning av officiell statistik ska behovet av skydd för fysiska och juridiska personers intressen beaktas. Uppgifter som samlas in av myndigheter för framställning av statistik omfattas av statistiksekretess. Vidare är statistiksekretess viktigt ur kvalitetssynpunkt, eftersom skyddet...

Full description

Bibliographic Details
Main Authors: Jonason, Alice, Mattiasson, Malin
Format: Others
Language:Swedish
Published: Stockholms universitet, Statistiska institutionen 2021
Subjects:
Online Access:http://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-194642
Description
Summary:Vid framställning av officiell statistik ska behovet av skydd för fysiska och juridiska personers intressen beaktas. Uppgifter som samlas in av myndigheter för framställning av statistik omfattas av statistiksekretess. Vidare är statistiksekretess viktigt ur kvalitetssynpunkt, eftersom skyddet upprätthåller förtroendet mellan statistikproducenter och uppgiftslämnare. Vikten av att skydda identiteter och insamlade uppgifter regleras i lag och understryks i flertalet etiska koder för statistiker.  Processen för att skydda datamaterial kallas statistisk röjandekontroll. Det finns ett flertal metoder att tillgå och målet är, oavsett metod, att optimera balansen mellan röjanderisk och användbarhet, dvs. minska risken för röjande samtidigt som användbarheten av datamaterialet hålls på en hög nivå.  Studien ämnar att tillämpa metoden riktad dataväxling på en ny sorts bytesvariabel. I tidigare studier har bytesvariabeln typiskt sett varit av geografisk karaktär, men i denna studie appliceras metoden i stället på en bytesvariabel som innehåller information om individers yrke. Därefter utvärderas tillämpningen av metoden med avseende på både risk och användbarhet.  Vad gäller röjanderisken, indikerar resultatet på ett gott skydd, där majoriteten av röjanderisken eliminerats från datamaterialet. Vad gäller användbarheten, är den fortsatt hög efter applicering av metoden. Eftersom dataväxling endast byter värden mellan individer förändras inte resultaten på univariat nivå. På bivariat nivå påverkas sambandsmått och fördelningar inom delpopulationer, om än marginellt. På trivariat nivå noteras något större förändringar, jämfört med bivariat nivå. Det resultat som erhålls från logistisk regression med fyra inblandade variabler, har påverkats i liten utsträckning. Sammanfattningsvis indikerar studiens resultat att yrke fungerar väl som bytesvariabel för metoden, med avseende på både risk och användbarhet.