Relation statistique et notion de causalité
Une problématique fréquemment rencontrée dans les sciences de la santé est celle de la comparaison de deux groupes : comparaison d'un groupe traité par un médicament à un groupe traité par un autre médicament afin de savoir quel traitement est le plus efficace, comparaison d'un groupe de personnes exposées à un facteur à un groupe de personnes non exposées afin de savoir si ce facteur est lié à la survenue d'une maladie, etc. Dans ces cas, la constitution des groupes à comparer est parfois difficile (difficultés techniques, mais également éthiques).
Reprenons l'exemple de la comparaison des traitements X et Y. Différentes solutions pourraient être utilisées afin de répartir les traitements administrés. On pourrait définir des critères de répartition : par exemple les hommes reçoivent le traitement X, les femmes reçoivent le traitement Y. Ce choix n'est cependant probablement pas adéquat ; en effet, les différences physiologiques existant entre les hommes et les femmes pourraient entraîner une différence systématique de réponse au traitement entre ces deux groupes qui ne serait pas due uniquement au traitement. On pourrait également décider de laisser le choix au patient du traitement qu'il souhaite recevoir, mais là encore les groupes ainsi constitués pourraient différer systématiquement sur certains facteurs, en particulier certains facteurs psychologiques. Au total, si l'on souhaite étudier l'effet médicament et uniquement l'effet médicament, il faut que les deux groupes constitués ne diffèrent que sur le facteur médicament et se ressemblent sur tous les autres points. Là encore, la solution est de répartir les traitements de manière aléatoire, par tirage au sort (appelé randomisation). Lorsque le facteur d'exposition (dans cet exemple le facteur d'exposition est le traitement) est ainsi contrôlé par l'expérimentateur (le choix n'est pas laissé au patient), on parle d'enquête de type expérimental.
Cependant, les études de type expérimental ne sont pas toujours, voire rarement, possibles dans le domaine de la santé humaine, en particulier lorsqu'il s'agit d'étudier des facteurs supposés délétères pour la santé. Il parait en effet difficilement envisageable d'exposer volontairement une personne à un facteur que l'on suppose être nocif. Ainsi, dans bien des cas, la démarche expérimentale sera abandonnée, et l'on choisira une démarche de type observationnel. C'est le cas, par exemple, lorsque l'on souhaite étudier le lien entre tabagisme et cancer du poumon : le facteur tabac ne sera pas attribué par tirage au sort dans une population, il ne sera possible que d'observer une répartition qui n'a rien d'aléatoire (ici : choix individuel des personnes). Les études observationnelles sont méthodologiquement de moins bonne qualité que les études expérimentales.
Les tests statistiques permettent de savoir si la différence que l'on observe entre deux (ou plusieurs) groupes comparés peut être due uniquement au simple hasard de l'échantillonnage, ou si au contraire le hasard ne permet pas à lui seul d'expliquer une différence aussi importante (on parle alors de différence statistiquement significative). Cependant, un lien statistique ne signifie pas forcément lien de causalité ; une interprétation causale est en particulier impossible dans les études observationnelles. La causalité ne peut être affirmée que dans des études expérimentales comparatives randomisées bien menées.