Statistiques de base

Cas des variables quantitatives

Présentation du jeu de données

Nous allons travailler sur la série de données suivante qui représente 200 mesures de la taille des patients admis dans un hôpital. La variable aléatoire quantitative continue sera notée X.

__

Nous allons distinguer 3 groupes de paramètres :

Les paramètres de tendances centrales

La médiane

C'est la valeur de la variable qui divise la série de données en 2 parties de telle sorte qu'une moitié des valeurs lui sont inférieures et l'autre lui sont supérieures.

Exemple

La médiane de X est 152 cm

La moyenne

Nous parlerons dans ce cours uniquement de la moyenne arithmétique. C'est le rapport entre la somme de l'ensemble des valeurs observées sur le nombre total d'unités statistiques.

Soit X une variable quantitative mesurée sur N d'individus. Soient x1, x2, ..., xN les valeurs observées.

observées. La moyenne de X notée m ou

est donnée par la formule suivante :

Exemple

La moyenne de X est 151,5 cm

Les paramètres de position

Le premier quartile (Q1)

C'est la valeur de la variable qui divise l'ensemble de la distribution en 2 parties de telle manière que l'ensemble des valeurs qui lui sont inférieures représente 25% de la distribution. On peut aussi la définir comme la plus grande des 25% plus petites valeurs de la distribution. On le note souvent Q1.

Exemple

Q1= 143 cm

Le deuxième quartile (Q2)

Il s'agit de la médiane que nous avons définie plus haut.

Le troisième quartile (Q3)

C'est la valeur de la variable qui divise l'ensemble de la distribution en 2 parties de telle manière que l'ensemble des valeurs qui lui sont supérieures représente 25% de la distribution. On peut aussi la définir comme la plus petite des 25% plus grandes valeurs de la distribution. On le note souvent Q3.

Exemple

Q3= 159 cm

Les paramètres de dispersion

Étendu interquartile

C'est la différence entre Q3 et Q1. Il s'agit d'une mesure de la dispersion qui concerne 50% des valeurs les plus fréquentes en neutralisant les valeurs extrême inhabituelles. Elle indique l'écart maximum entre les valeurs constituant 50% de la distribution.

Exemple

L'étendu interquartile = 16 cm

La variance et l'écart-type

La variance est la somme des carrés des écarts à la moyenne divisé par le nombre d'observation.

Si nous reprenons les notations utilisées dans la définition de la moyenne ci-dessus la variance est donnée par la formule suivante :

Remarque

NB : Quand on veut estimer la variance d'une variable X à partir d'un échantillon (une partie de la population sélectionnée au hasard) de taille n on utilise la variance « corrigée » divisée par n-1 que l'on note Sx2.

Exemple

variance = 168,32 cm2 écart-type=12,97 cm

Coefficient de variation (CV)

Le coefficient de variation est le rapport de l'écart-type à la moyenne exprimé en pourcentage. C'est un nombre sans dimension qui permet de comparer la variabilité de phénomènes mesurés avec différentes unités

Exemple

CV =9%

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Reproduction et diffusion interdite sans accord des auteurs. Réalisé avec Scenari (nouvelle fenêtre)