Statistiques de base

Cas d'une variable quantitative

Box plot ou boîte à moustache

C'est une représentation graphique très synthétique d'une variable quantitative continue et qui permet de visualiser rapidement la tendance centrale et la dispersion des valeurs.

Pour cela, les indicateurs requis, calculé à partir de la séries de données sont : une borne supérieure (BorneSup), une borne inférieure (BorneInf), les quartiles 1 (25%), 2 (50%) ou la médiane et le 3 (75%).

La borne inférieure est une valeur calculée à partir de la série de données et en dessous de laquelle toute autre valeur (de la série) est considérée comme extrême. La formule est la suivante :

La borne supérieure est une valeur calculée à partir de la série de données et au-dessus de laquelle toute autre valeur de la série est considérée comme extrême. La formule est la suivante :

Nous allons construire pas à pas une boîte à moustache. Pour cela considérons la série de données suivante :

Les indicateurs requis sont résumés dans le tableau suivant :

BorneInf

-1,5

Q1 = 25%

15

Q2 = 50%

20

Q3 = 75%

26

BorneSup

42,5

Etape 1

Nous représentons les valeurs de la série de données sur un axe.

_

Etape 2

Nous représentons Q1, Q2 et Q3 par des barres verticales à leurs positions respectives.

_

Etape 3

Nous relions les segments de Q1 et Q3 pour obtenir la boîte. Par définition, cette boîte contient 50% des observations puisqu'elle délimite l'espace interquartile.

_

Etape 4

Il nous faut maintenant déterminer la position des moustaches

  • La moustache inférieure correspond à la plus petite valeur supérieure ou égale à la BorneInf. Soit 5

  • La moustache supérieure correspond à la plus grande valeur inférieure à la BorneSup. Soit 38

_

Etape 5

Et voilà, nous observons qu'il n'y a pas des valeurs considérées comme extrême dans cette série de données.

Exemple

Soit le tableau suivant résumant les caractéristiques des 2 variables VarX et VarY. La figure en dessous montre l'intérêt des boîtes à moustaches dans la comparaison des variables quantitatives.

VarX

VarY

Minimum

0,75

0,74

BorneInf

2,41

5,23

Q1 = 25%

41,30

38,11

Q2 = 50%

54,62

49,19

Q3 = 75%

67,23

60,03

BorneSup

106,13

92,91

Maximum

115,35

115,35

_

Pratiques : Les boîtes à moustaches de cet exemple ont été tracées à partir du logiciel Excel® 2010

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Reproduction et diffusion interdite sans accord des auteurs. Réalisé avec Scenari (nouvelle fenêtre)