Moyenne, médiane, classe modale et dispersion d'une série statistique
Une étude statistique comprend en général les étapes suivantes :
1. on précise les questions auxquelles on veut répondre ;
2. on procède à une enquête, on collecte les données ;
3. on présente ces données dans un tableau ;
4. on représente cette série statistique à l'aide d'un diagramme ;
5. intervient enfin le mathématicien qui procède au calcul de paramètres permettant de caractériser toute la série statistique à l'aide de quelques nombres.
1. Comment établir le tableau d'une série statistique ?
En statistiques, on appelle population l'ensemble sur lequel on travaille.
Dans cette population, on étudie un caractère que l'on appelle variable statistique. On étudie principalement des variables quantitatives, c'est-à-dire des variables qui prennent des valeurs numériques.
La variable quantitative peut être :
soit discrète, quand elle prend un nombre fini de valeurs ;
-
soit continue, quand elle prend toute valeur comprise entre deux nombres donnés.
Quand la variable statistique X est discrète, on compte pour chaque valeur de X le nombre d'individus prenant cette valeur ; c'est l'effectif de la valeur. On aboutit à un tableau du type :
Quand la variable statistique X est continue, on regroupe les valeurs en classes.
Les classes sont des intervalles semi-ouverts . Leur amplitude est le nombre
et leur centre, le nombre .
Pour chaque classe, on compte le nombre d'individus qui prennent une valeur supérieure ou égale à et inférieure à : c'est l'effectif de la classe. On aboutit à un tableau du type :
Remarques
Quand le nombre de valeurs prises par la variable statistique est trop grand, on traite la variable discrète comme une variable continue.
-
Quand on regroupe les valeurs par classes, on essaye d'avoir des classes de même amplitude et pas trop nombreuses. Mais, souvent, les valeurs extrêmes posent problème, c'est pourquoi les premières ou dernières classes sont soit ouvertes, soit d'amplitude différente des autres classes.
2. Comment représenter une série statistique ?
Pour représenter une variable statistique discrète, on utilise un diagramme en bâtons (chaque bâton a une hauteur proportionnelle à l'effectif et/ou à la fréquence) ou un diagramme circulaire (chaque secteur est proportionnel à l'effectif et/ou à la fréquence).
Par exemple, la répartition sociologique de 60 étudiants est la suivante : 8 ouvriers ; 23 cadres ; 15 professions libérales ; 11 enseignants et 3 autres.
Pour représenter cette série par un diagramme circulaire, on calcule pour chaque secteur l'angle au centre. Pour le secteur « ouvriers », l'angle au centre est de , soit 48°.
On procède de même pour les autres secteurs et on obtient le diagramme suivant :
Pour représenter une variable statistique continue, on trace un histogramme. L'histogramme est constitué de rectangles juxtaposés dont la surface est proportionnelle à l'effectif de la classe correspondante.
Si les classes ont des amplitudes égales, la hauteur des rectangles est proportionnelle à l'effectif. Si les classes ont des amplitudes inégales, on représente la classe ayant la plus petite amplitude ; puis on compense une amplitude k fois plus grande par une hauteur k fois plus petite.
3. Comment calculer une moyenne ?
Quand la série statistique est discrète, de taille n, on peut la représenter sous forme d'un tableau du type :
où .
On appelle moyenne de X le nombre :
.
Quand la série statistique est continue, de taille n, on a un tableau du type :
Pour calculer la moyenne d'une telle série, on utilise la formule précédente en remplaçant par le centre de l'intervalle .
La moyenne de X est alors le nombre :
, où .
4. Comment utiliser les propriétés de la moyenne ?
Lorsque l'on modifie les valeurs d'une série statistique par des opérations simples, il n'est pas toujours nécessaire de recommencer le calcul de la moyenne.
On utilise les propriétés suivantes :
5. Comment calculer une médiane ?
La médiane est le nombre qui sépare la série ordonnée en valeurs croissantes en deux groupes de même effectif.
Pour la trouver, on écrit la liste de toutes les valeurs de la série par ordre croissant, chacune d'elles étant répétée autant de fois que son effectif.
On distingue ensuite deux cas :
si l'effectif total n est un nombre impair, la médiane est le terme de rang ;
-
si l'effectif total n est un nombre pair, la médiane est le centre de l'intervalle formé par les termes de rang et .
Quand la série est regroupée par classes, on détermine la médiane graphiquement à partir du polygone des effectifs ou des fréquences cumulés.
On calcule pour chaque classe l'effectif cumulé croissant , c'est-à-dire le nombre d'individus qui prennent une valeur inférieure à . On place ensuite dans un repère les points , on obtient ainsi le polygone des effectifs cumulés croissants.
La médiane est l'abscisse du point dont l'ordonnée est .
6. Quels autres paramètres peut-on calculer ?
Les mathématiciens disent parfois qu'il existe autant de paramètres statistiques que de statisticiens. Sans aller jusque-là, on peut donner ou calculer, outre la moyenne et la médiane, les paramètres suivants :
les valeurs extrêmes, c'est-à-dire la plus grande valeur et la plus petite valeur atteintes par la série ;
-
l'étendue, c'est-à-dire la différence entre la plus grande et la plus petite valeur prises par la variable, soit ;
-
le mode (ou la classe modale), c'est-à-dire la valeur (ou la classe) ayant le plus grand effectif.
Remarque
Un paramètre, quel qu'il soit, n'a guère de sens en lui-même. Les enseignements que l'on peut tirer d'une série statistique proviennent plus souvent de la comparaison des paramètres entre eux.
À retenir absolument
La moyenne de X est le nombre : .
La médiane est le nombre qui sépare la série en deux groupes de même effectif.
|