Aspects of Moment Testing when p>n
This thesis concerns the problem of statistical hypothesis testing for mean vector as well as testing for non-normality in a high-dimensional setting which is called the Kolmogorov condition. Since we consider mainly the first and the second moment in testing for mean vector and we utilize the third...
Main Author: | |
---|---|
Format: | Others |
Language: | English |
Published: |
Linnéuniversitetet, Institutionen för nationalekonomi och statistik (NS)
2018
|
Subjects: | |
Online Access: | http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-79294 http://nbn-resolving.de/urn:isbn:978-91-88898-35-7 http://nbn-resolving.de/urn:isbn:978-91-88898-36-4 |
id |
ndltd-UPSALLA1-oai-DiVA.org-lnu-79294 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-UPSALLA1-oai-DiVA.org-lnu-792942019-01-19T05:56:56ZAspects of Moment Testing when p>nengWang, ZhizhengLinnéuniversitetet, Institutionen för nationalekonomi och statistik (NS)Växjö2018High-dimensional dataAsymptotic distributionKolmogorov conditionMonte Carlo simulationHypothesis testingSkewness and kurtosisProbability Theory and StatisticsSannolikhetsteori och statistikThis thesis concerns the problem of statistical hypothesis testing for mean vector as well as testing for non-normality in a high-dimensional setting which is called the Kolmogorov condition. Since we consider mainly the first and the second moment in testing for mean vector and we utilize the third and the fourth moment in testing for non-normality, this thesis concerns a more general moment testing problem. The research question is related to a data matrix with $p$ rows, which is the number of parameters and $n$ columns which is the sample size, where $p$ can exceed $n$, assuming that the ratio $\frac{p}{n}$ converges when both the number of parameters and the sample size increase. The first paper reviews the Dempster's non-exact test for mean vector, with a focus on one-sample case. We investigated its size and power properties compared to Hotelling's $\mathit{T}^2$ test as well as Srivastava's test using Monte Carlo simulation. The second paper concerns the problem of testing for multivariate non-normality in high-dimensional data. We proposed three test statistics which are based on marginal skewness and kurtosis. Simulation studies are carried out for examining the size and power properties of the three test statistics. Avhandlingen undersöker hypotesprövning i höga dimensioner, under förutsättning att det så kallad Kolmogorovvillkoret (Kolmogorov condition) är uppfyllt. Villkoret innerbär att antalet parametrar ökar tillsammans med storleken på stickprovet med en konstant hastighet. Till kategorin multivariat analys räknas de statistiska metoder som analyserar stickprov från flerdimensionella fördelningar, särskilt multivariat normalfördelning. För högdimensionella data fungerar klassiska skattningar av kovariansmatris inte tillfredställande eftersom komplexiteten med att skatta den inversa kovariansmatrisen ökar när dimensionen ökar. I den första uppsatsen utförs en genomgång av Dempsters (non-exact) test där skattning av den inversa kovariansmatrisen inte behövs. Istället används spåret (trace) av en kovariansmatris. I den andra uppsatsen testas antagandet om normalfördelning med hjälp av tredje och fjärde ordningens moment. Tre olika testvariabler har föreslagits där sumuleringar också presenteras för att jämföra hur väl en icke-normalfördelning identifieras av testet. Licentiate thesis, comprehensive summaryinfo:eu-repo/semantics/masterThesistexthttp://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-79294urn:isbn:978-91-88898-35-7urn:isbn:978-91-88898-36-4Lnu Licentiate ; 23/2018application/pdfinfo:eu-repo/semantics/openAccess |
collection |
NDLTD |
language |
English |
format |
Others
|
sources |
NDLTD |
topic |
High-dimensional data Asymptotic distribution Kolmogorov condition Monte Carlo simulation Hypothesis testing Skewness and kurtosis Probability Theory and Statistics Sannolikhetsteori och statistik |
spellingShingle |
High-dimensional data Asymptotic distribution Kolmogorov condition Monte Carlo simulation Hypothesis testing Skewness and kurtosis Probability Theory and Statistics Sannolikhetsteori och statistik Wang, Zhizheng Aspects of Moment Testing when p>n |
description |
This thesis concerns the problem of statistical hypothesis testing for mean vector as well as testing for non-normality in a high-dimensional setting which is called the Kolmogorov condition. Since we consider mainly the first and the second moment in testing for mean vector and we utilize the third and the fourth moment in testing for non-normality, this thesis concerns a more general moment testing problem. The research question is related to a data matrix with $p$ rows, which is the number of parameters and $n$ columns which is the sample size, where $p$ can exceed $n$, assuming that the ratio $\frac{p}{n}$ converges when both the number of parameters and the sample size increase. The first paper reviews the Dempster's non-exact test for mean vector, with a focus on one-sample case. We investigated its size and power properties compared to Hotelling's $\mathit{T}^2$ test as well as Srivastava's test using Monte Carlo simulation. The second paper concerns the problem of testing for multivariate non-normality in high-dimensional data. We proposed three test statistics which are based on marginal skewness and kurtosis. Simulation studies are carried out for examining the size and power properties of the three test statistics. === Avhandlingen undersöker hypotesprövning i höga dimensioner, under förutsättning att det så kallad Kolmogorovvillkoret (Kolmogorov condition) är uppfyllt. Villkoret innerbär att antalet parametrar ökar tillsammans med storleken på stickprovet med en konstant hastighet. Till kategorin multivariat analys räknas de statistiska metoder som analyserar stickprov från flerdimensionella fördelningar, särskilt multivariat normalfördelning. För högdimensionella data fungerar klassiska skattningar av kovariansmatris inte tillfredställande eftersom komplexiteten med att skatta den inversa kovariansmatrisen ökar när dimensionen ökar. I den första uppsatsen utförs en genomgång av Dempsters (non-exact) test där skattning av den inversa kovariansmatrisen inte behövs. Istället används spåret (trace) av en kovariansmatris. I den andra uppsatsen testas antagandet om normalfördelning med hjälp av tredje och fjärde ordningens moment. Tre olika testvariabler har föreslagits där sumuleringar också presenteras för att jämföra hur väl en icke-normalfördelning identifieras av testet. |
author |
Wang, Zhizheng |
author_facet |
Wang, Zhizheng |
author_sort |
Wang, Zhizheng |
title |
Aspects of Moment Testing when p>n |
title_short |
Aspects of Moment Testing when p>n |
title_full |
Aspects of Moment Testing when p>n |
title_fullStr |
Aspects of Moment Testing when p>n |
title_full_unstemmed |
Aspects of Moment Testing when p>n |
title_sort |
aspects of moment testing when p>n |
publisher |
Linnéuniversitetet, Institutionen för nationalekonomi och statistik (NS) |
publishDate |
2018 |
url |
http://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-79294 http://nbn-resolving.de/urn:isbn:978-91-88898-35-7 http://nbn-resolving.de/urn:isbn:978-91-88898-36-4 |
work_keys_str_mv |
AT wangzhizheng aspectsofmomenttestingwhenpgtn |
_version_ |
1718814709109489664 |