Sur la propriété classement et dynamique sous-jacente des systèmes complexes

Des procédures de classement sont largement utilisées pour décrire les phénomènes observés dans de nombreux domaines des sciences sociales et naturelles, par exemple la sociologie, l'économie, la linguistique, la démographie, la physique, la biologie, etc.Dans cette thèse, nous nous sommes atta...

Full description

Bibliographic Details
Main Author:	Deng, Weibing
Language:	ENG
Published:	Université du Maine 2013
Subjects:	[PHYS:COND:CM_GEN] Physics/Condensed Matter/Other Systèmes de classement Lois puissance Principe de Pareto Loi de Zipf Classement sportif Langues humaines Probabilité a priori
Online Access:	http://tel.archives-ouvertes.fr/tel-00839310 http://tel.archives-ouvertes.fr/docs/00/83/93/10/PDF/2010LEMA1010_converti.pdf

id	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-00839310
record_format	oai_dc
collection	NDLTD
language	ENG
sources	NDLTD
topic	[PHYS:COND:CM_GEN] Physics/Condensed Matter/Other Systèmes de classement Lois puissance Principe de Pareto Loi de Zipf Classement sportif Langues humaines Probabilité a priori
spellingShingle	[PHYS:COND:CM_GEN] Physics/Condensed Matter/Other Systèmes de classement Lois puissance Principe de Pareto Loi de Zipf Classement sportif Langues humaines Probabilité a priori Deng, Weibing Sur la propriété classement et dynamique sous-jacente des systèmes complexes
description	Des procédures de classement sont largement utilisées pour décrire les phénomènes observés dans de nombreux domaines des sciences sociales et naturelles, par exemple la sociologie, l'économie, la linguistique, la démographie, la physique, la biologie, etc.Dans cette thèse, nous nous sommes attachés à l'étude des propriétés de classement et des dynamiques sous-jacentes intégrées dans les systèmes complexes. En particulier,nous nous sommes concentrés sur les classements par score ou par prix dans les systèmes sportifs et les classements d'utilisation des mots ou caractères dans les langues humaines. Le but est de comprendre les mécanismes sous-jacents à ces questions en utilisant les méthodes de la physique statistique, de la statistique bayésienne et de la modélisation multi-agents. Les résultats concrets concernent les aspects suivants.Nous avons tout d'abord traité une étude sur les classements par score/prix dans les systèmes sportifs et analysé 40 échantillons de données dans 12 disciplines sportives différentes. Nous avons trouvé des similitudes frappantes dans différents sports, à savoir le fait que la répartition des résultats/prix suit les lois puissance universelles.Nous avons également montré que le principe de Pareto est largement respecté dans de nombreux systèmes sociaux: ainsi 20% des joueurs accumulent 80% des scores et de l'argent. Les données concernant les matchs de tennis en individuels nous ont révélé que lorsque deux joueurs s'affrontent, la probabilité que le joueur de rang supérieur gagne est liée à la différence de rang des deux adversaires. Afin de comprendre les origines de la mise à l'échelle universelle, nous avons proposé un modèle multi-agents,qui peut simuler les matchs de joueurs à travers différentes compétitions. Les résultats de nos simulations sont cohérents avec les résultats empiriques. L'extension du domaine d'étude de la simulation indique que le modèle est assez robuste par rapport aux modifications de certains paramètres. La loi de Zipf est le comportement le plus régulièrement observé dans la linguistique statistique. Elle a dès lors servi de prototype pour les relations entre rang d'apparitions et fréquence d'apparitions (relations rang-fréquence dans la suite du texte) et les lois d'échelle dans les sciences naturelles. Nous avons étudié plusieurs textes, précisé le domaine de validité de la loi de Zipf, et trouvé que la plage de validité augmente lors du mélange de différents textes. Basé sur l'analyse sémantique latente, nous avons proposé un modèle probabiliste, dans lequel nous avons supposé que les mots sont ajoutés au texte avec des probabilités aléatoires, tandis que leur densité a priori est liée, via la statistique bayésienne, aux caractéristiques générales du lexique mental de l'auteur de ce même texte. Notre modèle explique la loi de Zipf ainsi que ses limites de validité, et la généralise aux hautes et basses fréquences et au hapax legomena.Dans une autre étude, nous avons précisé les relations rang-fréquence pour les caractères chinois. Nous avons choisi d'étudier des textes courts en premier, car pour le bien de l'analyse rang fréquence, les longs textes ne sont que des mélanges de textes plus courts, thématiquement homogènes. Nos résultats ont montré que la loi de Zipf appliqués aux caractères chinois tient parfaitement pour des textes assez courts (quelques milliers de caractères différents). Le même domaine de validité est observé pour les textes courts anglais. Nous avons soutenu que les longs textes chinois montrent une structure hiérarchique à deux couches: des caractères dont la fréquence d'apparition suit une loi puissance (première couche) et des caractères dont l'apparition suit une loi exponentielle (deuxième couche)...
author	Deng, Weibing
author_facet	Deng, Weibing
author_sort	Deng, Weibing
title	Sur la propriété classement et dynamique sous-jacente des systèmes complexes
title_short	Sur la propriété classement et dynamique sous-jacente des systèmes complexes
title_full	Sur la propriété classement et dynamique sous-jacente des systèmes complexes
title_fullStr	Sur la propriété classement et dynamique sous-jacente des systèmes complexes
title_full_unstemmed	Sur la propriété classement et dynamique sous-jacente des systèmes complexes
title_sort	sur la propriété classement et dynamique sous-jacente des systèmes complexes
publisher	Université du Maine
publishDate	2013
url	http://tel.archives-ouvertes.fr/tel-00839310 http://tel.archives-ouvertes.fr/docs/00/83/93/10/PDF/2010LEMA1010_converti.pdf
work_keys_str_mv	AT dengweibing surlaproprieteclassementetdynamiquesousjacentedessystemescomplexes
_version_	1716590015774982144
spelling	ndltd-CCSD-oai-tel.archives-ouvertes.fr-tel-008393102013-06-29T03:02:18Z http://tel.archives-ouvertes.fr/tel-00839310 2013LEMA1010 http://tel.archives-ouvertes.fr/docs/00/83/93/10/PDF/2010LEMA1010_converti.pdf Sur la propriété classement et dynamique sous-jacente des systèmes complexes Deng, Weibing [PHYS:COND:CM_GEN] Physics/Condensed Matter/Other Systèmes de classement Lois puissance Principe de Pareto Loi de Zipf Classement sportif Langues humaines Probabilité a priori Des procédures de classement sont largement utilisées pour décrire les phénomènes observés dans de nombreux domaines des sciences sociales et naturelles, par exemple la sociologie, l'économie, la linguistique, la démographie, la physique, la biologie, etc.Dans cette thèse, nous nous sommes attachés à l'étude des propriétés de classement et des dynamiques sous-jacentes intégrées dans les systèmes complexes. En particulier,nous nous sommes concentrés sur les classements par score ou par prix dans les systèmes sportifs et les classements d'utilisation des mots ou caractères dans les langues humaines. Le but est de comprendre les mécanismes sous-jacents à ces questions en utilisant les méthodes de la physique statistique, de la statistique bayésienne et de la modélisation multi-agents. Les résultats concrets concernent les aspects suivants.Nous avons tout d'abord traité une étude sur les classements par score/prix dans les systèmes sportifs et analysé 40 échantillons de données dans 12 disciplines sportives différentes. Nous avons trouvé des similitudes frappantes dans différents sports, à savoir le fait que la répartition des résultats/prix suit les lois puissance universelles.Nous avons également montré que le principe de Pareto est largement respecté dans de nombreux systèmes sociaux: ainsi 20% des joueurs accumulent 80% des scores et de l'argent. Les données concernant les matchs de tennis en individuels nous ont révélé que lorsque deux joueurs s'affrontent, la probabilité que le joueur de rang supérieur gagne est liée à la différence de rang des deux adversaires. Afin de comprendre les origines de la mise à l'échelle universelle, nous avons proposé un modèle multi-agents,qui peut simuler les matchs de joueurs à travers différentes compétitions. Les résultats de nos simulations sont cohérents avec les résultats empiriques. L'extension du domaine d'étude de la simulation indique que le modèle est assez robuste par rapport aux modifications de certains paramètres. La loi de Zipf est le comportement le plus régulièrement observé dans la linguistique statistique. Elle a dès lors servi de prototype pour les relations entre rang d'apparitions et fréquence d'apparitions (relations rang-fréquence dans la suite du texte) et les lois d'échelle dans les sciences naturelles. Nous avons étudié plusieurs textes, précisé le domaine de validité de la loi de Zipf, et trouvé que la plage de validité augmente lors du mélange de différents textes. Basé sur l'analyse sémantique latente, nous avons proposé un modèle probabiliste, dans lequel nous avons supposé que les mots sont ajoutés au texte avec des probabilités aléatoires, tandis que leur densité a priori est liée, via la statistique bayésienne, aux caractéristiques générales du lexique mental de l'auteur de ce même texte. Notre modèle explique la loi de Zipf ainsi que ses limites de validité, et la généralise aux hautes et basses fréquences et au hapax legomena.Dans une autre étude, nous avons précisé les relations rang-fréquence pour les caractères chinois. Nous avons choisi d'étudier des textes courts en premier, car pour le bien de l'analyse rang fréquence, les longs textes ne sont que des mélanges de textes plus courts, thématiquement homogènes. Nos résultats ont montré que la loi de Zipf appliqués aux caractères chinois tient parfaitement pour des textes assez courts (quelques milliers de caractères différents). Le même domaine de validité est observé pour les textes courts anglais. Nous avons soutenu que les longs textes chinois montrent une structure hiérarchique à deux couches: des caractères dont la fréquence d'apparition suit une loi puissance (première couche) et des caractères dont l'apparition suit une loi exponentielle (deuxième couche)... 2013-06-21 ENG PhD thesis Université du Maine

Sur la propriété classement et dynamique sous-jacente des systèmes complexes

Similar Items