Summary: | L'analyse des données généalogiques est un outil important pour comprendre la répartition du pool génétique d'une population sur un territoire ou pour établir si un trait (maladie ou autre) comporte une composante héréditaire majeure. La mesure des liens de parenté, utilisée dans notre étude, est le coefficient moyen d'apparentement.
Il existe peu d'études sur les propriétés statistiques du coefficient d'apparentement dû principalement à la dépendance inhérente et à la complexité de calcul de cette mesure ainsi qu'à l'indisponibilité de bases de données généalogiques fiables. Un test d'hypothèses faisant intervenir le coefficient moyen d'apparentement a été proposé par Hauck et Martin mais ce dernier est basé sur des résultats de normalité asymptotique et il n'est applicable que pour des tailles d'échantillons très grandes.
Le premier objectif de la recherche a été d'établir les limites des résultats de normalité asymptotique dont la statistique est le coefficient moyen d'apparentement dans un contexte plus réaliste : une population et des échantillons de tailles relativement petites. Le second objectif a été de construire des algorithmes permettant de calculer un intervalle de confiance et un test d'hypothèses sur cette statistique en utilisant des techniques de simulations spécifiques. Plusieurs méthodes de construction d'intervalles et de tests ont été comparées afin de dégager le meilleur estimateur par intervalle et le meilleur test.
Les meilleures méthodes de construction d'intervalles et de tests ont été obtenues à partir des techniques de rééchantillonnage. Elles ont permis d'obtenir d'excellents tests de comparaison. Cependant, les résultats concernant la détermination d'un intervalle de confiance sont mitigés. Il serait intéressant, lors de recherches ultérieures, de se pencher davantage sur ces techniques afin d'optimiser l'estimateur par intervalle.
Il n'existait pas de résultats de simulation portant sur les intervalles de confiance et les tests d'hypothèses faisant intervenir le coefficient moyen d'apparentement. Ces résultats sont un premier pas vers une meilleure compréhension des propriétés statistiques du coefficient moyen d'apparentement.
|