|
|
1.
|
Introduction
|
Les données forment le matériau
de base de la recherche empirique, que celle-ci comprenne
une expérimentation contrôlée ou de
simples observations. Par données, on
entend :
|
-
|
les quantités numériques que
l'on mesure (on parle de données brutes) et
qui, dans bien des cas, subissent un léger traitement
mathématique (on parle alors de données
traitées);
|
-
|
les informations factuelles que l'on
recueille (par exemple, auprès de sujets
humains).
|
D'un point de vue mathématique, les
données constituent les variables de la
recherche.
On distingue divers types de variables selon
la nature des données. Ainsi, une variable peut
être qualitative ou quantitative; une
variable qualitative peut être nominale ou
ordinale, alors qu'une variable quantitative peut
être continue ou discrète.
On qualifie également les variables
selon le lien qui existe ou que l'on cherche à
établir entre elles. On distingue variables
indépendantes et variables
dépendantes; dans certaines conditions, une
variable indépendante peut être appelée
paramètre ou variable externe.
|
2.
|
Types de variables
|
Une variable qualitative est une
variable dont les valeurs sont des caractéristiques
ou des catégories. Ces valeurs sont exprimées
à l'aide de noms plus ou moins significatifs (par
exemple, essai 1, essai 2, essai 3, ...) ou
de codes (par exemple, les lettres A, B, C).
Une variable qualitative est dite
ordinale si ses valeurs peuvent être
ordonnées, c'est-à-dire classées sans
ambiguïté de la plus petite à la plus
grande, par exemple des qualificatifs comme
« souvent » ou
« parfois », ou des mentions comme
« bien » et « très
bien »). Elle est dite nominale si ces
valeurs ne peuvent pas être ordonnées, du moins
a priori, par exemple les caractéristiques
socio-économiques comme la profession, le sexe, la
nationalité.
Une variable quantitative est une
variable dont les valeurs sont exprimées par des
nombres, accompagnés au besoin d'unités et
d'incertitudes.
Une variable quantitative est dite
discrète si elle ne peut prendre que des
valeurs bien précises (des entiers, par exemple,
comme celles qui résultent d'un dénombrement).
Elle est qualifiée de continue si elle peut
prendre en principe n'importe quelle valeur, même si
la précision du processus de mesure ou les conditions
de la recherche réduisent en pratique le nombre de
valeurs différentes obtenues.
|
3.
|
Variables dépendantes et
indépendantes
|
Une variable dépendante
(notée VD) est une variable dont la valeur est
influencée ou déterminée par les
valeurs d'une ou d'autres variables, appelées
variables indépendantes (notées
VI). Les variables dépendantes sont presque
toujours quantitatives, alors que les variables
indépendantes peuvent être autant qualitatives
que quantitatives.
Lors d'une expérimentation, il
arrivera souvent que l'on puisse fixer, de manière
plus ou moins précise, les valeurs de la ou des VI.
Par contre, on n'aura généralement aucune
emprise sur les valeurs de la VD, qui seront simplement
mesurées. L'expérimentation consistera
à donner à la ou aux VI une série de
valeurs et à mesurer à chaque fois la valeur
correspondante de la VD.
Quand plus d'une VI sont présentes ou
considérées dans une même
expérimentation, on effectuera
généralement plusieurs séries de
mesures. À chaque série correspond une
valeur d'une des VI, qui reste constante pendant qu'on fait
varier la seconde VI. Cette première VI, qui demeure
constante pendant qu'une autre varie, est souvent
appelée paramètre.
Si la valeur d'un paramètre ne peut
être choisie ou modifiée, il faut s'assurer que
cette valeur demeure constante tout au long de
l'expérimentation. On désigne parfois un tel
paramètre sous le nom de variable externe.
Finalement, le nombre de valeurs de chaque VD
sera égale au produit du nombre des valeurs de chaque
VI. Ainsi, si on a trois VI comprenant respectivement 2, 3
et 4 valeurs, il y aura 24 valeurs de VD, donc 24 cellules
dans un tableau, 24 barres dans un diagramme et
24 points dans un graphique.
Quand la recherche ne comprend pas une
expérimentation au sens propre, mais plutôt
l'observation de caractéristiques que l'on ne
contrôle pas, les notions de variables
indépendantes et dépendantes sont plus floues.
En général, on tentera de déceler une
corrélation entre deux variables, c'est-à-dire
un lien plus ou moins strict entre les variations de l'une
et de l'autre. Dans ce cas, la variable dépendante
sera celle dont on croit que la valeur dépend de
celle de l'autre variable; dans certains cas, cette
causalité s'imposera d'elle-même, mais pas dans
d'autres. Par exemple, si on trouve un lien entre la
température et la taille des plantes, c'est
sûrement cette dernière qui est la variable
dépendante. Mais la chose est moins évidente
si on observe un lien entre le poids des membres d'un
troupeau et la quantité de nourriture qu'ils
consomment : difficile de dire où est la cause
et où est l'effet...
Dans ces situations, il sera tout de
même important de s'assurer que les autres
paramètres qui pourraient jouer un rôle
demeurent constants, quitte, si on ne peut agir sur eux,
à contrôler leur valeur en ne retenant qu'une
partie des observations.
|
4.
|
Variables et choix du dispositif de
présentation
|
Le choix du dispositif de présentation
adéquat et la détermination de la structure
qui convient est plus un art qu'une science exacte. Il fait
intervenir plusieurs facteurs, certains liés au mode
de diffusion (les lecteurs auront-ils le temps d'examiner en
détail le dispositif), d'autres au nombre de valeurs,
d'autres enfin aux caractéristiques des
données que l'on souhaite mettre en évidence
afin d'appuyer notre argumentation ou nos conclusions.
Veut-on fournir une vue d'ensemble d'une série ou de
plusieurs séries de valeurs? Veut-on comparer des
valeurs au sein d'une même série, ou comparer
les séries de valeurs entre elles? Désire-t-on
illustrer la pertinence d'un modèle théorique
prédisant la valeur des VD à partir de celle
des VI?
Les dispositifs présentés dans
cette partie du cours et les gabarits qui vous sont fournis
pour les activités et travaux notés pourront
vous servir de sources d'inspiration, à tout le moins
pour constuire des dispositifs techniquement corrects. Le
reste est une question d'expérience et de
réflexion : plus on fait de graphiques, en
se demandant à chaque fois si ce qu'on fait est
à la fois utile et facile à
interpréter, plus on s'améliore.
Il existe cependant quelques règles ou
conventions qui font intervenir le type de variables dont on
présente les valeurs.
|
Les tableaux et les diagrammes
|
-
|
Sont employés surtout avec des VI
qualitatives ou quantitatives discrètes.
|
-
|
Peuvent afficher un nombre maximal de
valeurs, au-delà duquel ils deviennent beaucoup moins
efficaces.
|
-
|
S'ils comprennent plus d'une VI (donc
plusieurs séries de valeurs correspondant à
chaque valeur ou combinaison de valeurs des autres VI), il
faut choisir l'ordre des VI, donc le mode de regroupement
des valeurs en série, en tenant compte du fait que
les comparaisons deux-à-deux sont beaucoup plus
aisées entre des éléments (nombres ou
barres) contigus.
|
Les graphiques
|
-
|
Sont employés lorsqu'au moins une des
VI est quantitative (continue ou discrète).
|
-
|
Peuvent afficher des séries
(associées à chaque valeur ou combinaison de
valeurs des autres VI) en nombre limité, mais chacune
peut comprendre un très grand nombre de valeurs.
|
-
|
Conviennent pour mettre en évidence
des tendances et des corrélations,
c'est-à-dire des liens simples (du point de vue
mathématique) entre les variables, de même que
pour juger de l'adéquation d'un modèle.
|
|
|