Level set clustering in a flow cytometry dataset

Pro Gradu -työn tarkoituksena oli testata kuinka hyvin tasopuumenetelmä soveltuu virtaussytometria-aineiston klusterointiin, ja verrata sitä k-lähimmän naapurin menetelmään. Tasopuumenetelmää myös parannettiin lisäämällä Nelder-Mead (NM) -optimointimenetelmä yhteen työvaiheeseen, jotta laskenta-ajat...

Full description

Bibliographic Details
Main Author: Herrala, S. (Sauli)
Format: Dissertation
Language:English
Published: University of Oulu 2016
Subjects:
Online Access:http://urn.fi/URN:NBN:fi:oulu-201604191509
http://nbn-resolving.de/urn:nbn:fi:oulu-201604191509
Description
Summary:Pro Gradu -työn tarkoituksena oli testata kuinka hyvin tasopuumenetelmä soveltuu virtaussytometria-aineiston klusterointiin, ja verrata sitä k-lähimmän naapurin menetelmään. Tasopuumenetelmää myös parannettiin lisäämällä Nelder-Mead (NM) -optimointimenetelmä yhteen työvaiheeseen, jotta laskenta-ajat pysyisivät hallinnassa. Virtaussytometriassa mitataan yksittäisia soluja ja niiden ominaisuuksia, kun ne kulkevat laserin läpi. Ennen mittausta näyte on käsitelty fluerosoivalla aineella, jolloin solu hohtaa valon aallonpituuksia kulkiessaan laserin läpi. Nykyaikaiset laitteet pystyvät mittaamaan satoja tuhansia soluja ja kymmeniä aallonpituuksia kerralla. Tälläisen aineiston käsittely perinteisillä menetelmillä on erittäin raskasta. FlowCAP-konsortio perustettiin testaamaan kuinka hyvin erilaiset klusterointi- ja luokittelumenetelmät soveltuvat sytometria-aineiston käsittelyyn. Tässä gradussa käytetään FlowCAP II -kisasta “akuutti myelooinen leukemia” -aineistoa, joka sisältää 43 sairastunutta ja 359 tervettä verrokkia. Henkilön luokitteleminen terveisiin ja sairaisiin tehtiin tukivektorikoneella tasopuumenetelmästä tai k-lähimmän naapurin menetelmästä saatuja klustereita hyödyntäen. NM-menetelmällä saatiin selvä ajallinen hyöty ilman suurempaa menetystä tarkkuudessa, koska NM-menetelmä pääsi aina hyvin lähelle alkuperäisen algoritmin tulosta. Tasopuumenetelmä itsessään ei ollut k-lähimmän naapurin menetelmää parempi. Tämä johtui osaksi siitä, että variaatio tasopuumenetelmän tuloksien välillä oli hyvin suuri. Ero tasopuumenetelmän ja k-lähimmän naapurin menetelmän välillä oli kuitenkin pieni.