Statistiques de base

Population et échantillon

  • La population est l'ensemble des individus

  • Population cible c'est l'ensemble des individus visés par une étude dont on voudra recueillir des informations et extrapoler – généraliser les résultats

Exemple

Mener un essai clinique auprès de patients ayant un cancer du rectum T3-T4 permettra selon des conditions de définition stricte de cette population d'extrapoler les résultats à l'ensemble de ces patients

  • Unités : il peut s'agir d'unité individuelle (patient) ou collective (école, hôpitaux)

  • Population source : c'est la population dont on peut recueillir l'information et donc laquelle on extrait l'échantillon

Figure 1 : Schéma synthétique (d'après Frédéric Mauny)
  • Recensement : exhaustif tous les individus de la population cibles sont considérés et étudiés

  • Echantillonnage : processus qui consiste à recueillir et observer les informations que sur une partie de la population (= échantillon) ciblée. Plusieurs échantillons peuvent être générés dans cette population

  • L'échantillon permet sous des conditions, notamment de représentativité de la population cible, de réaliser des conclusions sur cette dernière. Il s'agit d'inférence statistique. De fait ce ne sont pas en soi les résultats sur l'échantillon qui sont intéressants mais les conclusions licites qui pourront être réalisées sur la population cible.

Les avantages de cette procédure d'étude sur un échantillon en comparaison à un recensement exhaustif son la durée d'étude, la qualité des données qui peut être optimisée, et donc le coût des études.

En outre d'un point de vue éthique il n'est pas utile d'inclure plus de patients que requis quand les résultats peuvent être obtenus sur un sous-ensemble.

L'inconvénient majeur demeure l'incertitude de la représentativité pour faire l'inférence statistique.

La principale qualité requise pour un échantillon est donc d'être« représentatif » :

  • tout individu de la population cible peut figurer dans l'échantillon avec une probabilité non nulle, connue et égale pour tous les individus présentant les mêmes caractéristiques,

  • cette condition est assurée uniquement par un tirage au sort,

  • si les prérequis cités sont réunis cela conduit à des estimations non biaisées et à faire de l'inférence statistique/ inférence causale.

Ce sont les modalités de constitution d'un échantillon (et non les résultats obtenus) qui permet de le qualifier de représentatif.

Cette méthode doit donc être clairement décrite dans toutes les études épidémiologiques.

Toutes les méthodes d'échantillonnage aléatoire supposent l'existence d'une base de sondage à partir de laquelle on tire aléatoirement (mais avec probabilité connue) un échantillon sans biais dont la taille a été déterminée à la suite de considérations sur le niveau de précision souhaité.

Figure 2 : Synthèse de la mise en place d'une étude
PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimer Reproduction et diffusion interdite sans accord des auteurs. Réalisé avec Scenari (nouvelle fenêtre)