Neparametriniai kriterijai retų įvykių dažnių lentelėms
Disertacijoje sprendžiami neparametrinių hipotezių tikrinimo uždaviniai išretintoms dažnių lentelėms. Problemos, susijusios su retų įvykių dažnių lentelėmis yra plačiai aptartos mokslinėje literatūroje. Yra pasiūlyta visa eilė metodų: tikslieji testai, alternatyvūs aproksimavimo būdai parametrinė ir...
Main Author: | |
---|---|
Other Authors: | |
Format: | Doctoral Thesis |
Language: | Lithuanian |
Published: |
Lithuanian Academic Libraries Network (LABT)
2013
|
Subjects: | |
Online Access: | http://vddb.laba.lt/fedora/get/LT-eLABa-0001:E.02~2013~D_20130218_142212-35398/DS.005.0.01.ETD |
id |
ndltd-LABT_ETD-oai-elaba.lt-LT-eLABa-0001-E.02~2013~D_20130218_142212-35398 |
---|---|
record_format |
oai_dc |
spelling |
ndltd-LABT_ETD-oai-elaba.lt-LT-eLABa-0001-E.02~2013~D_20130218_142212-353982014-01-17T03:47:48Z2013-02-18litMathematicsSamusenko, PavelNeparametriniai kriterijai retų įvykių dažnių lentelėmsNonparametric criteria for sparse contingency tablesLithuanian Academic Libraries Network (LABT)Disertacijoje sprendžiami neparametrinių hipotezių tikrinimo uždaviniai išretintoms dažnių lentelėms. Problemos, susijusios su retų įvykių dažnių lentelėmis yra plačiai aptartos mokslinėje literatūroje. Yra pasiūlyta visa eilė metodų: tikslieji testai, alternatyvūs aproksimavimo būdai parametrinė ir neparametrinė saviranka, Bayeso ir kiti metodai. Tačiau jie nepritaikomi arba yra neefektyvūs neparametrinėje labai išretintų dažnių lentelių analizėje. Disertacijoje parodyta, kad labai išretintiems kategoriniams duomenims tikėtinumo santykio statistika ir Pearsono χ2 statistika gali pasidaryti neinformatyviomis: jos jau nėra tinkamos nulinės hipotezės ir duomenų suderinamumui matuoti. Vadinasi, jų pagrindu sudaryti kriterijai gali būti net nepagrįsti net tuo atveju, kai egzistuoja paprastas pagrįstas kriterijus. Darbe yra pasiūlytas klasikinių kriterijų patobulinimas išretintų dažnių lentelėms. Siūlomi kriterijai remiasi išretintų kategorinių duomenų grupavimu ir glodinimu naudojant naują išretinimo asimtotikos modelį, kuris remiasi (išplėstine) empirine Bayeso metodologija. Prie bendrų sąlygų yra įrodytas siūlomų kriterijų, naudojančių grupavimą, pagrįstumas. Kriterijų elgesys baigtinių imčių atveju tiriamas taikant Monte Carlo modeliavimą. Disertacija susideda iš įvado, 4 skyrių, literatūros sąrašo, bendrų išvadų ir priedo. Įvade atskleidžiama nagrinėjamos mokslinės problemos svarba, aprašomi darbo tikslai ir uždaviniai, tyrimo metodai, mokslinis naujumas, praktinė gautų... [toliau žr. visą tekstą]In the dissertation, the problem of nonparametric testing for sparse contingency tables is addressed. Statistical inference problems caused by sparsity of contingency tables are widely discussed in the literature. Traditionally, the expected (under null the hypothesis) frequency is required to exceed 5 in almost all cells of the contingency table. If this condition is violated, the χ2 approximations of goodness of fit statistics may be inaccurate and the table is said to be sparse . Several techniques have been proposed to tackle the problem: exact tests, alternative approximations, parametric and nonparametric bootstrap, Bayes approach and other methods. However they all are not applicable or have some limitations in nonparametric statistical inference of very sparse contingency tables. In the dissertation, it is shown that, for sparse categorical data, the likelihood ratio statistic and Pearson’s χ2 statistic may become noninformative: they do not anymore measure the goodness-of-fit of null hypotheses to data. Thus, they can be inconsistent even in cases where a simple consistent test does exist. An improvement of the classical criteria for sparse contingency tables is proposed. The improvement is achieved by grouping and smoothing of sparse categorical data by making use of a new sparse asymptotics model relying on (extended) empirical Bayes approach. Under general conditions, the consistency of the proposed criteria based on grouping is proved. Finite sample behavior of... [to full text]Retų įvykių dažnių lentelėsTikėtinumo santykio statistikaPearsono χ2 statistikaNeparametriniai kriterijaiLarge number of rare eventsLikelihood ratio statisticPearson χ2Nonparametric criteriaDoctoral thesisRadavičius, MarijusKubilius, KęstutisBikelis, Algimantas JonasDučinskas, KęstutisMeilūnas, MečislavasVaitkus, PranasBagdonavičius, VilijandasSunklodas, Jonas KazysVilnius Gediminas Technical UniversityVilnius Gediminas Technical Universityhttp://vddb.laba.lt/obj/LT-eLABa-0001:E.02~2013~D_20130218_142212-35398LT-eLABa-0001:E.02~2013~D_20130218_142212-35398VGTU-nmbaoefosks-20130214-142555http://vddb.laba.lt/fedora/get/LT-eLABa-0001:E.02~2013~D_20130218_142212-35398/DS.005.0.01.ETDUnrestrictedapplication/pdf |
collection |
NDLTD |
language |
Lithuanian |
format |
Doctoral Thesis |
sources |
NDLTD |
topic |
Mathematics Retų įvykių dažnių lentelės Tikėtinumo santykio statistika Pearsono χ2 statistika Neparametriniai kriterijai Large number of rare events Likelihood ratio statistic Pearson χ2 Nonparametric criteria |
spellingShingle |
Mathematics Retų įvykių dažnių lentelės Tikėtinumo santykio statistika Pearsono χ2 statistika Neparametriniai kriterijai Large number of rare events Likelihood ratio statistic Pearson χ2 Nonparametric criteria Samusenko, Pavel Neparametriniai kriterijai retų įvykių dažnių lentelėms |
description |
Disertacijoje sprendžiami neparametrinių hipotezių tikrinimo uždaviniai išretintoms dažnių lentelėms.
Problemos, susijusios su retų įvykių dažnių lentelėmis yra plačiai aptartos mokslinėje literatūroje. Yra pasiūlyta visa eilė metodų: tikslieji testai, alternatyvūs aproksimavimo būdai parametrinė ir neparametrinė saviranka, Bayeso ir kiti metodai. Tačiau jie nepritaikomi arba yra neefektyvūs neparametrinėje labai išretintų dažnių lentelių analizėje.
Disertacijoje parodyta, kad labai išretintiems kategoriniams duomenims tikėtinumo santykio statistika ir Pearsono χ2 statistika gali pasidaryti neinformatyviomis: jos jau nėra tinkamos nulinės hipotezės ir duomenų suderinamumui matuoti. Vadinasi, jų pagrindu sudaryti kriterijai gali būti net nepagrįsti net tuo atveju, kai egzistuoja paprastas pagrįstas kriterijus.
Darbe yra pasiūlytas klasikinių kriterijų patobulinimas išretintų dažnių lentelėms. Siūlomi kriterijai remiasi išretintų kategorinių duomenų grupavimu ir glodinimu naudojant naują išretinimo asimtotikos modelį, kuris remiasi (išplėstine) empirine Bayeso metodologija. Prie bendrų sąlygų yra įrodytas siūlomų kriterijų, naudojančių grupavimą, pagrįstumas. Kriterijų elgesys baigtinių imčių atveju tiriamas taikant Monte Carlo modeliavimą.
Disertacija susideda iš įvado, 4 skyrių, literatūros sąrašo, bendrų išvadų ir priedo.
Įvade atskleidžiama nagrinėjamos mokslinės problemos svarba, aprašomi darbo tikslai ir uždaviniai, tyrimo metodai, mokslinis naujumas, praktinė gautų... [toliau žr. visą tekstą] === In the dissertation, the problem of nonparametric testing for sparse contingency tables is addressed.
Statistical inference problems caused by sparsity of contingency tables are widely discussed in the literature. Traditionally, the expected (under null the hypothesis) frequency is required to exceed 5 in almost all cells of the contingency table. If this condition is violated, the χ2 approximations of goodness of fit statistics may be inaccurate and the table is said to be sparse . Several techniques have been proposed to tackle the problem: exact tests, alternative approximations, parametric and nonparametric bootstrap, Bayes approach and other methods. However they all are not applicable or have some limitations in nonparametric statistical inference of very sparse contingency tables.
In the dissertation, it is shown that, for sparse categorical data, the likelihood ratio statistic and Pearson’s χ2 statistic may become noninformative: they do not anymore measure the goodness-of-fit of null hypotheses to data. Thus, they can be inconsistent even in cases where a simple consistent test does exist.
An improvement of the classical criteria for sparse contingency tables is proposed. The improvement is achieved by grouping and smoothing of sparse categorical data by making use of a new sparse asymptotics model relying on (extended) empirical Bayes approach. Under general conditions, the consistency of the proposed criteria based on grouping is proved. Finite sample behavior of... [to full text] |
author2 |
Radavičius, Marijus |
author_facet |
Radavičius, Marijus Samusenko, Pavel |
author |
Samusenko, Pavel |
author_sort |
Samusenko, Pavel |
title |
Neparametriniai kriterijai retų įvykių dažnių lentelėms |
title_short |
Neparametriniai kriterijai retų įvykių dažnių lentelėms |
title_full |
Neparametriniai kriterijai retų įvykių dažnių lentelėms |
title_fullStr |
Neparametriniai kriterijai retų įvykių dažnių lentelėms |
title_full_unstemmed |
Neparametriniai kriterijai retų įvykių dažnių lentelėms |
title_sort |
neparametriniai kriterijai retų įvykių dažnių lentelėms |
publisher |
Lithuanian Academic Libraries Network (LABT) |
publishDate |
2013 |
url |
http://vddb.laba.lt/fedora/get/LT-eLABa-0001:E.02~2013~D_20130218_142212-35398/DS.005.0.01.ETD |
work_keys_str_mv |
AT samusenkopavel neparametriniaikriterijairetuivykiudazniulentelems AT samusenkopavel nonparametriccriteriaforsparsecontingencytables |
_version_ |
1716626689854799872 |