LES INDICATEURS DE VALEUR CENTRALE, DE DISPERSION ET DE CONCENTRATION
- LES INDICATEURS DE VALEUR CENTRALE
- La moyenne arithmétique
Pour synthétiser une série de nombres, on utilise une valeur essentielle, la moyenne arithmétique.
Soit n observations x1, x2, …, xn. La moyenne arithmétique, notée X, est
X = x1 + x2 + … + xn
n
Exemple :
Cinq personnes gagent respectivement 5 000 F, 6 000 F, 7000F, 8000F, et 10 000F par mois, leur revenu moyen est égal à :
X = 5000 + 6000 + 7000 + 8000 + 10 000 = 7 200 F
5
En remplaçant une série de nombre par la moyenne des nombres de cette série, on perd de l’information. Il faut en avoir conscience. On peur se noyer dans une rivière qui a 20cm de profondeur en moyenne.
Les moyennes peuvent être tirées vers le haut ou vers le bas par le poids important de quelques éléments ; ainsi, dans un pays d’un million d’habitants où tout le monde gagnerait 4 000 francs sauf une personne qui gagnerait 4 milliards de francs, le revenu moyen serait de 8 000 francs.
C’est pour cette raison qu’on préfère parfois le revenu médian au revenu moyen.
- La médiane
Une fois que les grandeurs d’une série ont été ordonnées selon un ordre croissant, la médiane permet de connaître la valeur qui partage le nombre d’observations en deux parts égales.
Sur l’exemple utilisé lors de la présentation de la moyenne, la médiane est de 7 000F puisque deux valeurs (5 000F et 6 000F) sont inférieures à 7 000F et deux valeurs (8 000F et 10 000F) sont supérieures à 7 000F.
Lorsque le nombre d’observations est pair, la médiane peut se situer entre deux observations.
Exemple : six personnes gagnent respectivement 5000F, 5500F, 6500F, 7000F, 8000F et 10000F par mois, le revenu médian est situé entre 6500F et 7000F. On fait alors la moyenne arithmétique de ces deux valeurs ; on obtient un revenu médian de 6 750F. La médiane est une valeur centrale très significative. Il est par exemple important de savoir qu’en 1992 la moitié des hommes ont reçu un salaire net inférieur à 8 530F par mois alors que la moitié des femmes ont reçu un salaire net inférieur à 7 280F par mois.
- LES INDICATEURS DE DISPERSION
Si les indicateurs de valeur centrale sont nécessaires pour caractériser une série, ils ne sont pas suffisants. Deux séries qui ont les mêmes valeurs centrales peuvent être très différentes de part et d’autre de cette valeur centrale.
Soit A et B deux séries de notes.
A= 2, 4, 10, 16, 18
B = 8, 9, 10, 11, 12
Ces deux séries ont la même moyenne et la même médiane (10), mais les notes ne sont pas reparties de la même manière.
Il est donc nécessaire d’étudier leur dispersion.
- L’écart type
On cherche la moyenne des écarts à la moyenne mais comme il y a des valeurs au dessus de la moyenne et des valeurs au-dessous de la moyenne, la moyenne des écarts à la moyenne est égale à 0.
Pour lever cette difficulté, on élève au carré les écarts à la moyenne et on calcule la racine carrée de la moyenne du carré des écarts à la moyenne.
Exemple
(à partir des données utilisées pour illustrer la moyenne et la médiane)
xi |
(xi – x) |
xi – x)² |
5000
6000
7000
8000
10 000
35 000 |
-2200
-1200
-200
800
2800
0 |
4 840 000
1 440 000
40 000
640 000
7 840 000
14 800 000 |
N= 5
n
∑ xi
x = i = 1 = 36 000 = 7 200
n 5
n
Ecart-type = ∑ (xi – x)²
i = 1 = 14 800 000 = 1 720,5F
n 5
Tout se passé comme si les revenues se situaient, en moyenne à 1 720,50F en plus ou en moins du revenue moyen.
- Les déciles
De la même façon que la médiane divise la série en deux groupes égaux, les 9 déciles divisent la série en 10 groupes égaux (chaque groupe contient 10% des observations).
Le coefficient de dispersion est égal au rapport décile 9/Décile 1.
Exemple
(À partir des inégalités de salaire des hommes et des femmes dans e secteur privé et semi-public en France en 1992).
Calculer pour les hommes et pour les femmes, les coefficients de dispersion D9/D1.
Salaires mensuels nets par tranche de 10% dans le secteur privé et semi-public en France en 1992 (source : INSEE)
Pour les hommes, le coefficient de dispersion D9/D1 est égale à 18 010/5 620 = 3,2. Cela signifie que le salaire au-dessus duquel se situent les 10% des salariés masculins les mieux rémunérés en 1992 est égal à 3,2 fois le salaire en dessous duquel se situent les 10% des salariés masculins les moins bien rémunérés.
Pour les femmes, le coefficient de dispersion D9/D1 est égal à 12 440/4 830 = 2,6. Cela signifie que le salaire au-dessus duquel se situent les 10% des salariés féminins les mieux rémunérés en 1992 est égal à 2,6 fois le salaire en dessous duquel se situent les 10% des salariés féminins les moins bien rémunérés.
Les hommes ont un salaire médian supérieur (de17,2%) au salaire médian des femmes.
La dispersion des salaires des hommes est en outre plus forte que la dispersion des salaires des femmes (3,2 est > à 2,6).
- LES INDICATEURS DE CONCENTRATION
On partage la population étudiée en 10 groupes égaux ; ils représentent chacun 10% de la population.
Groupes |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Part du revenu détenu par chaque groupe (%) |
2,2 |
3,8 |
4,9 |
6,0 |
7,2 |
8,8 |
10,6 |
12,6 |
16,1 |
27,8 |
Part cumulée du revenu (%) |
2,2 |
6 |
10,9 |
16,9 |
24,1 |
32,9 |
43,5 |
56,1 |
72,2 |
100 |
La concentration du revenu en 1986
(Source : données sociales 1990, ENSEE)
Les 10% des ménages dont les revenus sont les plus faibles se partagent 2,2% des revenus.
Les 20% des ménages dont les revenus sont les plus faibles se partagent 6% des revenus (2,2% + 3,8% = 6%)
Les 10% des ménages dont les revenus sont les plus élevés se partagent 27,8% des revenus. Les 90% des ménages dont les revenus sont les plus faibles se partagent donc 72,2% des revenus (100% - 27,8% = 72,2%).
A partir de ces données, on trace la courbe de Lorenz.
En abscisse, sont inscrits les 10 groupes qui partagent la population.
En ordonnée, sont inscrites les parts cumulées du revenu.
La répartition aurait été parfaitement égalitaire si la courbe de Lorenz de la grandeur étudié avait été confondue avec la première bissectrice. 10% des ménages dont les revenus sont les plus faibles se partageraient 10% des revenus, 20% des ménages dont les revenus sont les plus faibles se partageraient 20% des revenus x% des ménages dont les revenus sont les plus faibles se partageraient x% des revenus, quel que soit le point de la diagonale.
En revanche, on obtiendrait une répartition parfaitement inégalitaire si un seul salarié percevrait la totalité du revenu, les autres ne recevant rien. Sur le graphique, cette situation correspond à la courbe OAB formée par deux cotés du carré.
En réalité, on se trouve quelque part entre ces deux situations extrêmes, quelque part entre la première bissectrice OB et la courbe OAB.
Plus la courbe de Lorenz est proche de la première bissectrice, plus la concentration de la grandeur étudiée est faible.
Plus la courbe de Lorenz est loin de la première bissectrice, plus la concentration de la grandeur étudiée est forte
La concentration est donc d’autant plus forte que la courbe de la grandeur étudiée est loin de la première bissectrice.
Le rapport entre la surface située entre la première bissectrice et la courbe étudiée et la surface située dans le triangle situé sous la première bissectrice donne un autre indicateur de concentration : le coefficient de Gini.
Ce coefficient égal à 0 indique une répartition parfaitement égalitaire.
Un coefficient égal à 1 indique une répartition parfaitement inégalitaire.
Plus le coefficient de Gini est proche de 1, plus la concentration de la grandeur étudiée est forte.
|