EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa
Tutkielmassa tutkitaan suurimman uskottavuuden menetelmään perustuvaa Expected Maximization-algoritmia (EM-algoritmi). Työn pääpaino on algoritmin ominaisuuksien teoreettisessa tarkastelussa eikä siinä käsitellä todellisia tutkimusongelmia tai empiirisiä aineistoja. Aluksi tarkastellaan algoritmia...
Main Author: | |
---|---|
Format: | Dissertation |
Language: | Finnish |
Published: |
University of Oulu
2013
|
Subjects: | |
Online Access: | http://urn.fi/URN:NBN:fi:oulu-201312051972 http://nbn-resolving.de/urn:nbn:fi:oulu-201312051972 |
id |
ndltd-oulo.fi-oai-oulu.fi-nbnfioulu-201312051972 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-oulo.fi-oai-oulu.fi-nbnfioulu-2013120519722018-06-20T04:57:47ZEM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissaKuismin, M. (Markku)info:eu-repo/semantics/openAccess© Markku Kuismin, 2013StatisticsTutkielmassa tutkitaan suurimman uskottavuuden menetelmään perustuvaa Expected Maximization-algoritmia (EM-algoritmi). Työn pääpaino on algoritmin ominaisuuksien teoreettisessa tarkastelussa eikä siinä käsitellä todellisia tutkimusongelmia tai empiirisiä aineistoja. Aluksi tarkastellaan algoritmia matemaattisesti SU-menetelmän tavoin. Tämä teoriaosuus perustuu pääsääntöisesti McLachlanin ja Krishnanin kirjaan The EM Algorithm and Extensions (1997). Algoritmin avulla tutkitaan kahden normaalijakauman sekoitusta ja tähän liittyviä parametreja. Tämä esimerkki perustuu pääsääntöisesti Louisin (1982) artikkeliin. EM-algoritmin lisäksi tutkitaan Monte Carlo EM-algoritmia (MCEM-algoritmi). Algoritmia sovelletaan yksinkertaisen yleistetyn lineaarisen sekamallin parametrien analysoinnissa. Aineistona käytetään McCullochin artikkelin esimerkin mukaan simuloitua binääristä dataa. Tässä osuudessa lähteinä on pääsääntöisesti käytetty McCullochin artikkelia Maximum likelihood algorithms for generalized linear mixed models (1997) ja Robertin ja Casellan kirjaa Introducing Monte Carlo Methods with R (2010). Lopuksi vertaillaan muodostetulla MCEM-algoritmilla laskettuja estimaatteja toiseen Markovin ketju Monte Carlo-menetelmään. Tätä varten simuloitua aineistoa analysoidaan myös bayesiläisittäin soveltamalla Gibbsin otantaa parametrien posteriorien simuloimisessa. Pääasiallisena lähteenä on käytety Läärän kirjoittamaa luentomonistetta Johdatus bayesiläiseen tilastotieteeseen (2013). EM-algoritmilla saatiin normaalijakaumien sekoituksessa erittäin hyviä SU-estimaatteja. Algoritmi on herkkä alkuarvojen valinnalle ja kaukana SU-estimaateista valituilla alkuarvoilla algoritmia on ajettava kauan uskottavuuden maksimoimiseksi. MCEM-algoritmin tapauksessa Monte Carlo otoskoon valitseminen liian suureksi lähinnä hidastaa algoritmia kohtuuttomasti eikä millään tavalla edistä algoritmin stabiloitumista. Tutkielmassa ei saatu MCEM-algoritmilla estimaatteja, jotka olisivat maksimoineet uskottavuusfunktion arvon. Laskemalla aineistosta bootsrap-estimaatit saatiin paremmat tulokset, joilla uskottavuusfunktion arvo on MCEM-estimaatteja suurempi.University of Oulu2013-12-05info:eu-repo/semantics/masterThesisinfo:eu-repo/semantics/publishedVersionapplication/pdfhttp://urn.fi/URN:NBN:fi:oulu-201312051972urn:nbn:fi:oulu-201312051972fin |
collection |
NDLTD |
language |
Finnish |
format |
Dissertation |
sources |
NDLTD |
topic |
Statistics |
spellingShingle |
Statistics Kuismin, M. (Markku) EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
description |
Tutkielmassa tutkitaan suurimman uskottavuuden menetelmään perustuvaa Expected Maximization-algoritmia (EM-algoritmi). Työn pääpaino on algoritmin ominaisuuksien teoreettisessa tarkastelussa eikä siinä käsitellä todellisia tutkimusongelmia tai empiirisiä aineistoja.
Aluksi tarkastellaan algoritmia matemaattisesti SU-menetelmän tavoin. Tämä teoriaosuus perustuu pääsääntöisesti McLachlanin ja Krishnanin kirjaan The EM Algorithm and Extensions (1997). Algoritmin avulla tutkitaan kahden normaalijakauman sekoitusta ja tähän liittyviä parametreja. Tämä esimerkki perustuu pääsääntöisesti Louisin (1982) artikkeliin.
EM-algoritmin lisäksi tutkitaan Monte Carlo EM-algoritmia (MCEM-algoritmi). Algoritmia sovelletaan yksinkertaisen yleistetyn lineaarisen sekamallin parametrien analysoinnissa. Aineistona käytetään McCullochin artikkelin esimerkin mukaan simuloitua binääristä dataa. Tässä osuudessa lähteinä on pääsääntöisesti käytetty McCullochin artikkelia Maximum likelihood algorithms for generalized linear mixed models (1997) ja Robertin ja Casellan kirjaa Introducing Monte Carlo Methods with R (2010).
Lopuksi vertaillaan muodostetulla MCEM-algoritmilla laskettuja estimaatteja toiseen Markovin ketju Monte Carlo-menetelmään. Tätä varten simuloitua aineistoa analysoidaan myös bayesiläisittäin soveltamalla Gibbsin otantaa parametrien posteriorien simuloimisessa. Pääasiallisena lähteenä on käytety Läärän kirjoittamaa luentomonistetta Johdatus bayesiläiseen tilastotieteeseen (2013).
EM-algoritmilla saatiin normaalijakaumien sekoituksessa erittäin hyviä SU-estimaatteja. Algoritmi on herkkä alkuarvojen valinnalle ja kaukana SU-estimaateista valituilla alkuarvoilla algoritmia on ajettava kauan uskottavuuden maksimoimiseksi. MCEM-algoritmin tapauksessa Monte Carlo otoskoon valitseminen liian suureksi lähinnä hidastaa algoritmia kohtuuttomasti eikä millään tavalla edistä algoritmin stabiloitumista. Tutkielmassa ei saatu MCEM-algoritmilla estimaatteja, jotka olisivat maksimoineet uskottavuusfunktion arvon. Laskemalla aineistosta bootsrap-estimaatit saatiin paremmat tulokset, joilla uskottavuusfunktion arvo on MCEM-estimaatteja suurempi. |
author |
Kuismin, M. (Markku) |
author_facet |
Kuismin, M. (Markku) |
author_sort |
Kuismin, M. (Markku) |
title |
EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
title_short |
EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
title_full |
EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
title_fullStr |
EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
title_full_unstemmed |
EM- ja MCEM-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
title_sort |
em- ja mcem-algoritmi apuvälineenä suurimman uskottavuuden estimoinnissa |
publisher |
University of Oulu |
publishDate |
2013 |
url |
http://urn.fi/URN:NBN:fi:oulu-201312051972 http://nbn-resolving.de/urn:nbn:fi:oulu-201312051972 |
work_keys_str_mv |
AT kuisminmmarkku emjamcemalgoritmiapuvalineenasuurimmanuskottavuudenestimoinnissa |
_version_ |
1718697475718512640 |