Événements langagiers rares et acquisition du langage

La loi de Zipf-Mandelbrot décrit la répartition des événements langagiers comme suivant une loi de puissance. Une des propriétés de cette loi est que les éléments les plus rares sont chacun uniques, mais que globalement ils sont très diversifiés et très nombreux. Cette loi est le plus souvent co...

Full description

Bibliographic Details
Main Author: Parisse Christophe
Format: Article
Language:English
Published: EDP Sciences 2014-07-01
Series:SHS Web of Conferences
Online Access:http://dx.doi.org/10.1051/shsconf/20140801339
Description
Summary:La loi de Zipf-Mandelbrot décrit la répartition des événements langagiers comme suivant une loi de puissance. Une des propriétés de cette loi est que les éléments les plus rares sont chacun uniques, mais que globalement ils sont très diversifiés et très nombreux. Cette loi est le plus souvent considérée seulement du point de vue de l’écrit et de la compréhension du langage. Théoriquement elle devrait aussi s’appliquer aux corpus oraux, y compris au langage produit par une seule personne. Si c’était le cas, alors la conséquence surprenante est qu’un locuteur produit un grand nombre de termes une seule fois (ou peu de fois) au cours de sa vie, et qu’une grande partie du vocabulaire acquis dans l’enfance ou utilisé à l’âge adulte n’est basé que sur quelques exemplaires. L’article teste l’existence des caractéristiques de la loi de Zipf sur une série de corpus enfant-adulte, y compris un corpus dit dense de 2 millions de mots. Ne disposant pas de corpus de « taille humaine » (plusieurs années de production ou de compréhension du langage), la comparaison avec des corpus écrits est également faite. Il ressort que rien ne permet d’infirmer l’application de la loi de Zipf aux corpus de langage oral, et en particulier les conséquences pour les items rares. Ces conséquences, prises au sérieux, ont une répercussion importante sur le système langagier. Une discussion de ces conséquences et de leurs implications pour la recherche en linguistique est présentée en conclusion.
ISSN:2261-2424