Nous avons vu des indicateurs permettant de mesurer le lien entre deux variables : coefficient de corrélation et le khi2/V de Cramer.
http://bienvenudansladata.com/jeune-demoiselle-recherche-un-mec-mortel-paroleL’étude des relations entre phénomènes est un jonchée de pièges dans lesquels il est facile de tomber et qu’il faut apprendre à éviter :
- Corrélations croisées
- Corrélation ≠ causalité
Pièges n° 1 : les corrélations croisées
Pour illustrer ce point, je vous propose de prendre l’exemple (célèbre) de la détection de cause d’une maladie infantile. Un médecin se propose d’étudier le comportement des enfants et d’observer les différences de comportement entre les enfants malades et les enfants non malades :
rencontre homme homme montreal
L’étude conclut à un lien entre le fait de manger de la glace et celui de contracter la maladie :
Dans cette conclusion, il y a une erreur due aux corrélations croisées. Effectivement, le lien entre l’apparition des 2 événements n’est du qu’au lien qui existe entre ces 2 événements et la température extérieure.
Dans l’étude des liens entre des événements, il faut toujours se demander si on n’oublie aucun facteur extérieur.
Pièges n° 2 : Corrélation ≠ causalité
La corrélation ne signifie pas la causalité.
Les indicateurs de corrélation ou de dépendance ne donnent pas de sens à la corrélation.
Statistiquement, aucun indicateur permet de déterminer le sens de la corrélation.
Comment faire ?
On peut :
- Regarder l’arrivée dans le temps des événements.
- Mettre en place un protocole d’expérimentation pour contrôler l’impact d’un phénomène sur l’autre.