Statistiques de base

Cours

Chapitre d'introduction - Auteurs : Nicolas Meyer, Gilles Nuémi, Nicolas Jay, Mariette Mercier
Chapitres 2 et 3 - Probabilités - Auteur : Nicolas Jay -
Chapitre 4 - Variables aléatoires et lois de probabilités - Auteur : Gilles Nuémi
Chapitre 5 - Extension de la notion de variable aléatoire - Auteur : Gilles Nuémi
Chapitre 6 - Description d'une variable qualitative et d'une variable quantitative - Auteur : Gilles Nuémi
Chapitre 7 - Description de deux variables qualitative et deux variables quantitatives - Auteur : Gilles Nuémi
Chapitre 8 - Description des variables : graphiques de bases - Auteur : Gilles Nuémi
Chapitre 9 - Échantillon et population - Auteur : Franck Bonnetain
- Introduction
- Définitions
  - Population et échantillon
  - Biais et dispersion
- Les différents modes de sondage pour réaliser un échantillon
Chapitre 10 - Estimation : principe et applications - Auteur : Mariette Mercier
Chapitre 11 - Test d'hypothèse nulle - Auteur : Nicolas Meyer
Chapitre 12 - Comparaisons de proportions - Auteur : Nicolas Meyer
Chapitre 13 - Test du X² : test d'indépendance et test d'homogénéité - Auteur : Nicolas Meyer
Chapitre 14 - Comparaison de deux moyennes - Auteur : Nicolas Meyer

Population et échantillon

La population est l'ensemble des individus
Population cible c'est l'ensemble des individus visés par une étude dont on voudra recueillir des informations et extrapoler – généraliser les résultats

Exemple :

Mener un essai clinique auprès de patients ayant un cancer du rectum T3-T4 permettra selon des conditions de définition stricte de cette population d'extrapoler les résultats à l'ensemble de ces patients

Unités : il peut s'agir d'unité individuelle (patient) ou collective (école, hôpitaux)
Population source : c'est la population dont on peut recueillir l'information et donc laquelle on extrait l'échantillon

Figure 1 : Schéma synthétique (d'après Frédéric Mauny)

Recensement : exhaustif tous les individus de la population cibles sont considérés et étudiés
Echantillonnage : processus qui consiste à recueillir et observer les informations que sur une partie de la population (= échantillon) ciblée. Plusieurs échantillons peuvent être générés dans cette population
L'échantillon permet sous des conditions, notamment de représentativité de la population cible, de réaliser des conclusions sur cette dernière. Il s'agit d'inférence statistique. De fait ce ne sont pas en soi les résultats sur l'échantillon qui sont intéressants mais les conclusions licites qui pourront être réalisées sur la population cible.

Les avantages de cette procédure d'étude sur un échantillon en comparaison à un recensement exhaustif son la durée d'étude, la qualité des données qui peut être optimisée, et donc le coût des études.

En outre d'un point de vue éthique il n'est pas utile d'inclure plus de patients que requis quand les résultats peuvent être obtenus sur un sous-ensemble.

L'inconvénient majeur demeure l'incertitude de la représentativité pour faire l'inférence statistique.

La principale qualité requise pour un échantillon est donc d'être« représentatif » :

tout individu de la population cible peut figurer dans l'échantillon avec une probabilité non nulle, connue et égale pour tous les individus présentant les mêmes caractéristiques,
cette condition est assurée uniquement par un tirage au sort,
si les prérequis cités sont réunis cela conduit à des estimations non biaisées et à faire de l'inférence statistique/ inférence causale.

Ce sont les modalités de constitution d'un échantillon (et non les résultats obtenus) qui permet de le qualifier de représentatif.

Cette méthode doit donc être clairement décrite dans toutes les études épidémiologiques.

Toutes les méthodes d'échantillonnage aléatoire supposent l'existence d'une base de sondage à partir de laquelle on tire aléatoirement (mais avec probabilité connue) un échantillon sans biais dont la taille a été déterminée à la suite de considérations sur le niveau de précision souhaité.

Figure 2 : Synthèse de la mise en place d'une étude

Accueil

Imprimer Reproduction et diffusion interdite sans accord des auteurs.