Institut THOMASTA : Quelles seront les nouvelles technologies  de demain ?

  | Contactez-nous

 

Relevés statistiques

Les relevés statistiques font partie de notre quotidien. C'est pourquoi il est important de comprendre comment ils sont établis, et quelle exploitation on peut en faire. Plusieurs questions se posent : quelles sont les méthodes des enquêteurs ? Une fois les données recueillies, est-il possible de les résumer par des paramètres ? Comment calcule-t-on ces paramètres ? Quels sont ceux qui permettent de comparer facilement deux séries statistiques ?

1. Comment élaborer une enquête statistique ?

Une enquête statistique porte sur un ensemble appelé population et qui est composé d'individus. Elle consiste à étudier un caractère au sein de cette population.

L'élaboration d'une enquête statistique comprend trois étapes principales.

1.1. Définition d'une problématique

Celle-ci doit être précise. Ainsi la question « Quel est le nombre de battements cardiaques à la minute ? » est trop vague. Il convient de préciser si les individus sur lesquels porte l'étude sont au repos ou non, à quelle tranche d'âge ils appartiennent, s'ils ont une activité sportive régulière.

1.2. Recensement des données à collecter

Cela revient à élaborer une codification des données.

1.3. Établissement d'un protocole de recueil

Lors du recueil des données, il convient de tenir compte des fluctuations de l'expérience. Ainsi pour l'étude du nombre de battements cardiaques à la minute, on pourra effectuer trois mesures et en garder la valeur moyenne.

Il convient également de tenir compte des caractéristiques des individus sélectionnés pour l'enquête de façon à constituer un échantillon représentatif de la population totale.

2. Avec quels paramètres caractériser une série statistique ?

Pour caractériser une série statistique, on cherche en premier lieu pour quelles valeurs du caractère la fréquence d'observation est la plus grande. On distingue ainsi trois paramètres de position : le mode, la moyenne et la médiane.

Le mode est la valeur du caractère à laquelle correspond un effectif maximal.

La moyenne est la moyenne pondérée des valeurs prises par le caractère. Soit ni l'effectif

correspondant à la valeur xi du caractère : .

Si une série statistique contient des valeurs extrêmes incohérentes, on calcule alors sa moyenne élaguée en éliminant ces valeurs extrêmes aberrantes.

La médiane est la valeur du caractère qui partage la série ordonnée des valeurs en deux sous-ensembles de même effectif. Si le nombre de valeurs de la série est impair, c'est-à-dire de la forme , la médiane est la valeur du milieu, celle de rang . Si ce nombre est pair, de la forme 2n, la médiane est la moyenne des valeurs de rangs n et .

3. Comment caractériser la dispersion d'une série ?

De nouveaux paramètres vont nous permettre de quantifier la dispersion d'une série. On les appelle paramètres de dispersion.

Les quartiles sont les valeurs du caractère qui partagent la série ordonnée des données en quatre sous-ensembles à peu près de même effectif.

Le premier quartile est la plus petite valeur du caractère telle qu'au moins 25 % des données sont inférieures ou égales à cette valeur. On le note Q1.

Le troisième quartile est la plus petite valeur du caractère telle qu'au moins 75 % des données sont inférieures ou égales à cette valeur. On le note Q3.

Ces quartiles sont les plus utilisés. Remarquons que le deuxième quartile ne correspond pas exactement à la médiane.

On définit de la manière analogue les déciles, par rapport à une partition de la série en dix sous-ensembles de même effectif.

Le premier décile est la plus petite valeur du caractère telle qu'au moins 10 % des données sont inférieures ou égales à cette valeur. On le note D1.

Le neuvième décile est la plus petite valeur du caractère telle qu'au moins 90 % des données sont inférieures ou égales à cette valeur. On le note D9.

L'intervalle interquartile est l'intervalle [Q1 ; Q3] dont les extrémités sont le premier et le troisième quartile. L'écart interquartile est la longueur de l'intervalle interquartile, c'est-à-dire la différence Q3 - Q1 entre le troisième et le premier quartile.

L'intervalle interdécile est l'intervalle [D1 ; D9] dont les extrémités sont le premier et le neuvième décile. L'écart interdécile est la longueur de l'intervalle interdécile, c'est-à-dire la différence D9 - D1 entre le neuvième et le premier décile.

4. Comment résumer toutes ces données ?

Un résumé des données d'une enquête statistique peut être fourni sous la forme d'un diagramme « en boîte à moustaches », construit à l'aide des paramètres vus ci-dessus. Les « moustaches » correspondent aux valeurs extrêmes de la série.

À retenir absolument
Soit ni l'effectif correspondant à la valeur xi du caractère. La moyenne d'une série statistique est donnée par la formule : .

La médiane est la valeur du caractère qui partage la série ordonnée des valeurs en deux sous-ensembles de même effectif.

L'intervalle interquartile contient la moitié centrale des valeurs.

 

 

Prof.: Thomas TAMENOU - Thomasta.com -  Contactez-nous