En statistiques, les données sont classées en deux grandes catégories principales : qualitatives et quantitatives. Ces types déterminent comment les données peuvent être analysées et les outils statistiques ou graphiques qui leur sont adaptés. Voici une explication détaillée :
- Données qualitatives (ou catégoriques)
Les données qualitatives décrivent des qualités, des caractéristiques ou des catégories qui ne sont pas mesurables par des nombres de manière naturelle. Elles sont basées sur des attributs ou des labels.
Caractéristiques :
- Elles ne peuvent pas être additionnées ou soustraites directement.
- Elles sont souvent exprimées par des mots ou des codes (ex. "oui/non", "rouge/bleu").
- Elles sont divisées en deux sous-types :
- Nominales : Pas d’ordre ou de hiérarchie entre les catégories.
- Exemples : Couleurs (rouge, bleu, vert), genres (masculin, féminin), types de fruits (pomme, banane).
- Ordinales : Les catégories ont un ordre ou un classement, mais les écarts entre elles ne sont pas forcément mesurables.
- Exemples : Niveaux de satisfaction (faible, moyen, élevé), tailles de vêtements (S, M, L).
Analyse et outils :
- Mesures : Fréquences (ex. 20 % de "oui"), mode (catégorie la plus fréquente).
- Graphiques : Diagrammes en barres, diagrammes circulaires (camemberts).
- Exemple : Dans une enquête, 40 % des répondants préfèrent le thé, 60 % le café (données nominales).
- Données quantitatives (ou numériques)
Les données quantitatives représentent des quantités mesurables par des nombres. Elles permettent des opérations mathématiques comme l’addition ou la multiplication.
Caractéristiques :
- Elles expriment une grandeur ou une mesure.
- Elles sont divisées en deux sous-types :
- Discrètes : Valeurs entières, souvent issues d’un comptage, avec un nombre fini ou dénombrable d’options.
- Exemples : Nombre d’enfants dans une famille (0, 1, 2…), nombre de voitures vendues (5, 10, 15).
- Continues : Valeurs qui peuvent prendre n’importe quel réel dans un intervalle, souvent issues de mesures.
- Exemples : Taille d’une personne (1,75 m), température (23,4 °C), temps de course (12,56 s).
Analyse et outils :
- Mesures : Moyenne, médiane, écart-type, étendue, quartiles.
- Graphiques : Histogrammes (discrètes ou continues), boîtes à moustaches, nuages de points.
- Exemple : La moyenne des âges dans un groupe est de 35 ans (données discrètes), ou la température moyenne est de 22,5 °C (données continues).
Différences clés
Critère | Qualitatives | Quantitatives |
Nature | Catégories, labels | Nombres mesurables |
Exemples |
Couleur, opinion | Poids, âge, revenu |
Opérations | Pas d’addition ni soustraction | Addition, moyenne, etc. |
Sous-types |
Nominales, ordinales | Discrètes, continues |
Graphiques | Barres, camemberts | Histogrammes, boxplots |
Pourquoi cette distinction est importante ?
- Méthodes d’analyse : Les données qualitatives nécessitent des comptages ou des pourcentages, tandis que les quantitatives permettent des calculs plus complexes (moyenne, variance).
- Interprétation : Une donnée ordinale (ex. "bon/moyen/mauvais") ne peut pas être moyennée comme une donnée quantitative (ex. notes de 0 à 20).
- Contexte : Le choix des outils dépend du type. Par exemple, un histogramme ne convient pas à des données nominales comme les couleurs.
En résumé, disons que les données qualitatives décrivent "quoi" ou "quel type", tandis que les quantitatives mesurent "combien" ou "à quel point". Cette classification est la base de toute analyse statistique !