Les données dont nous disposons sont des mesures faites sur des individus (ou unités statistiques) issus d’une population.
On s’intéresse à une ou plusieurs particularités des individus appelées variables ou caractères.
Une variable peut prendre différentes valeurs appelées modalité.
L’ensemble des individus constitue l’échantillon étudié.
L’ensemble des fréquences associées à leur classe de valeurs est appelé distribution statistique.
Par exemple : le nombre de visites par jour où le nombre de visites est la fréquence et le jour la classe de valeurs
L’ensemble des valeurs associées à un individu est nommé série statistique.
On peut être confronté à plusieurs types de variables :
- quantitatives : deux types :
discret (valeur entière ou discontinue) : nombre de clics, âge, …
continu : durée d’une visite, montant d’une commande, …
Attention, ce n’est pas parce que votre variable est un chiffre que c’est une variable quantitative (ex : table de référence, …)
- qualitatives : deux types :
ordinal : mois, niveau d’études, satisfaction
nominal : statut marital, catégorie de produit, couleur des yeux, …
On peut passer d’une variable quantitative à une variable qualitative en discrétisant la variable quantitative c’est-à-dire en créant des classes de valeurs (article à venir)