Cas d'une variable quantitative
Box plot ou boîte à moustache
C'est une représentation graphique très synthétique d'une variable quantitative continue et qui permet de visualiser rapidement la tendance centrale et la dispersion des valeurs.
Pour cela, les indicateurs requis, calculé à partir de la séries de données sont : une borne supérieure (BorneSup), une borne inférieure (BorneInf), les quartiles 1 (25%), 2 (50%) ou la médiane et le 3 (75%).
La borne inférieure est une valeur calculée à partir de la série de données et en dessous de laquelle toute autre valeur (de la série) est considérée comme extrême. La formule est la suivante :
La borne supérieure est une valeur calculée à partir de la série de données et au-dessus de laquelle toute autre valeur de la série est considérée comme extrême. La formule est la suivante :
Nous allons construire pas à pas une boîte à moustache. Pour cela considérons la série de données suivante :
Les indicateurs requis sont résumés dans le tableau suivant :
BorneInf | -1,5 |
Q1 = 25% | 15 |
Q2 = 50% | 20 |
Q3 = 75% | 26 |
BorneSup | 42,5 |
Etape 3
Etape 4
Etape 5
Et voilà, nous observons qu'il n'y a pas des valeurs considérées comme extrême dans cette série de données.
Exemple :
Soit le tableau suivant résumant les caractéristiques des 2 variables VarX et VarY. La figure en dessous montre l'intérêt des boîtes à moustaches dans la comparaison des variables quantitatives.
VarX | VarY | |
---|---|---|
Minimum | 0,75 | 0,74 |
BorneInf | 2,41 | 5,23 |
Q1 = 25% | 41,30 | 38,11 |
Q2 = 50% | 54,62 | 49,19 |
Q3 = 75% | 67,23 | 60,03 |
BorneSup | 106,13 | 92,91 |
Maximum | 115,35 | 115,35 |
Pratiques : Les boîtes à moustaches de cet exemple ont été tracées à partir du logiciel Excel® 2010