Ajustement affine
Lorsque le nuage de points de la série double (X, Y) est à peu près aligné, on cherche une relation entre X et Y de la forme y = ax + b, qui donne de façon approchée Y en fonction de X ; c'est ce que l'on appelle un ajustement affine.
Plusieurs questions se posent. En premier lieu, quelles sont les différentes méthodes pour obtenir un ajustement affine ? Comment utiliser cet ajustement pour déterminer des valeurs de Y en connaissant des valeurs de X ? Enfin comment, pour un nuage de points non alignés, peut-on se ramener au cas affine par un simple changement de variable ?
1. Comment trouver rapidement un ajustement affine entre X et Y ?
Première méthode :
On part d'une série statistique double (xi ; yi), avec 1 i n, dont le nuage de points est à peu près aligné. On place G, le point moyen de ce nuage, et on trace « à vue » une droite D qui passe par ce point et au plus près du maximum de points.
L'équation de cette droite (obtenue par lecture graphique ou déterminée à partir de deux points de la droite) donne un ajustement affine de la série double (X, Y).
Seconde méthode :
La méthode de Mayer permet également de trouver rapidement un ajustement affine. Toujours pour une série dont le nuage est à peu près aligné, on scinde le tableau de la série double en deux « sous-tableaux » de tailles à peu près égales. On calcule pour chacun de ces sous-tableaux les points moyens G1 et G2.
L'équation de la droite (G1G2) fournit un ajustement affine de (X, Y).
2. Comment obtenir un ajustement affine par la méthode des moindres carrés ?
Si les ajustements affines que l'on obtient par les méthodes précédentes sont relativement rapides à calculer, ils ne sont pas les « meilleurs » ajustements que l'on puisse trouver. Pour déterminer le « meilleur » ajustement possible, on utilise la méthode des moindres carrés.
Soit une série double (xi ; yi), avec 1 i n, dont le nuage de points est à peu près aligné.
On considère une droite quelconque D d'équation y = ax + b.
Pour chaque point , on calcule le nombre (yi – axi – b)2. Cela revient à calculer le carré de la distance , où est le point d'abscisse xi appartenant à la droite D.
On calcule ensuite la somme de tous ces nombres de la façon suivante :
On peut considérer comme la « distance » entre la droite D et le nuage de points. Le meilleur ajustement est celui de l'équation de la droite pour laquelle est minimum.
On démontre que est minimum pour la droite D d'équation :
Cette droite s'appelle la droite de régression de Y en X.
3. Comment utiliser un ajustement affine ?
Soit une série double (xi ; yi), avec 1 i n. Après avoir appliqué une des méthodes précédentes, on obtient l'ajustement affine y = ax + b de la série double (X, Y).
Cette relation exprime de façon approchée Y en fonction de X. Ainsi, avec une valeur de X, on peut déterminer la valeur de Y en remplaçant x par cette valeur dans la relation y = ax + b.
4. Comment, dans certains cas, se ramener à un ajustement affine ?
Quand le nuage n'est pas aligné (ou quand son tracé pose problème), sa forme peut suggérer un ajustement par une fonction non affine. Cette fonction peut être une fonction polynôme, une fonction logarithme, une fonction exponentielle, etc.
Dans ce cas, on effectue tout d'abord un changement de variable sur l'une des deux variables statistiques. Ce changement de variable est toujours donné par l'énoncé. S'il porte sur la variable Y (il peut aussi porter sur X), sa forme est y' = f(y). Effectuer le changement de variable signifie que pour chaque valeur yi de Y, on calcule yi' = f(yi). On obtient à l'issue de cette étape une nouvelle série double (xi ; yi'), avec 1 i n.
On traite comme précédemment cette nouvelle série double. On trace le nuage de points et on vérifie qu'il est à peu près aligné. On calcule ensuite par la méthode des moindres carrés la droite de régression de Y en X. On obtient à l'issue de cette étape une relation de la forme y' = ax + b.
Pour finir, on revient à la variable initiale. On obtient alors une relation de la forme f(y) = ax + b, que l'on peut parfois simplifier.
À retenir
Lorsque le nuage de points de la série double (X, Y) est à peu près aligné, on cherche une relation entre X et Y de la forme y = ax + b ; c'est ce que l'on appelle un ajustement affine.
La droite d'équation y = ax + b qui passe le plus près possible des points du nuage est appelée la droite de régression de Y en X.
La droite de régression de Y en X obtenue par la méthode des moindres carrés est la droite :
passant par G, le point moyen du nuage de points ;
-
et de coefficient directeur a, a étant égal à :
L'équation réduite de la droite de régression est donnée par : .
|