C3 - Données, variables
et choix du dispositif de présentation

Sommaire

1.

Introduction

2.

Types de variables

3.

Variables dépendantes et indépendantes

4.

Types de variables et choix du dispositif de présentation

  

[ sommaire ]

[ suivant ]

1.

Introduction

Les données forment le matériau de base de la recherche empirique, que celle-ci comprenne une expérimentation contrôlée ou de simples observations. Par données, on entend :

-

les quantités numériques que l'on mesure (on parle de données brutes) et qui, dans bien des cas, subissent un léger traitement mathématique (on parle alors de données traitées);

-

les informations factuelles que l'on recueille (par exemple, auprès de sujets humains).

D'un point de vue mathématique, les données constituent les variables de la recherche.

On distingue divers types de variables selon la nature des données. Ainsi, une variable peut être qualitative ou quantitative; une variable qualitative peut être nominale ou ordinale, alors qu'une variable quantitative peut être continue ou discrète.

On qualifie également les variables selon le lien qui existe ou que l'on cherche à établir entre elles. On distingue variables indépendantes et variables dépendantes; dans certaines conditions, une variable indépendante peut être appelée paramètre ou variable externe.

  

[ sommaire ]

[ précédent ]

[ suivant ]

2.

Types de variables

Une variable qualitative est une variable dont les valeurs sont des caractéristiques ou des catégories. Ces valeurs sont exprimées à l'aide de noms plus ou moins significatifs (par exemple, essai 1, essai 2, essai 3, ...) ou de codes (par exemple, les lettres A, B, C).

Une variable qualitative est dite ordinale si ses valeurs peuvent être ordonnées, c'est-à-dire classées sans ambiguïté de la plus petite à la plus grande, par exemple des qualificatifs comme « souvent » ou « parfois », ou des mentions comme « bien » et « très bien »). Elle est dite nominale si ces valeurs ne peuvent pas être ordonnées, du moins a priori, par exemple les caractéristiques socio-économiques comme la profession, le sexe, la nationalité.

Une variable quantitative est une variable dont les valeurs sont exprimées par des nombres, accompagnés au besoin d'unités et d'incertitudes.

Une variable quantitative est dite discrète si elle ne peut prendre que des valeurs bien précises (des entiers, par exemple, comme celles qui résultent d'un dénombrement). Elle est qualifiée de continue si elle peut prendre en principe n'importe quelle valeur, même si la précision du processus de mesure ou les conditions de la recherche réduisent en pratique le nombre de valeurs différentes obtenues.

  

[ sommaire ]

[ précédent ]

[ suivant ]

3.

Variables dépendantes et indépendantes

Une variable dépendante (notée VD) est une variable dont la valeur est influencée ou déterminée par les valeurs d'une ou d'autres variables, appelées variables indépendantes (notées VI). Les variables dépendantes sont presque toujours quantitatives, alors que les variables indépendantes peuvent être autant qualitatives que quantitatives.

Lors d'une expérimentation, il arrivera souvent que l'on puisse fixer, de manière plus ou moins précise, les valeurs de la ou des VI. Par contre, on n'aura généralement aucune emprise sur les valeurs de la VD, qui seront simplement mesurées. L'expérimentation consistera à donner à la ou aux VI une série de valeurs et à mesurer à chaque fois la valeur correspondante de la VD.

Quand plus d'une VI sont présentes ou considérées dans une même expérimentation, on effectuera généralement plusieurs séries de mesures. À chaque série correspond une valeur d'une des VI, qui reste constante pendant qu'on fait varier la seconde VI. Cette première VI, qui demeure constante pendant qu'une autre varie, est souvent appelée paramètre.

Si la valeur d'un paramètre ne peut être choisie ou modifiée, il faut s'assurer que cette valeur demeure constante tout au long de l'expérimentation. On désigne parfois un tel paramètre sous le nom de variable externe.

Finalement, le nombre de valeurs de chaque VD sera égale au produit du nombre des valeurs de chaque VI. Ainsi, si on a trois VI comprenant respectivement 2, 3 et 4 valeurs, il y aura 24 valeurs de VD, donc 24 cellules dans un tableau, 24 barres dans un diagramme et 24 points dans un graphique.

Quand la recherche ne comprend pas une expérimentation au sens propre, mais plutôt l'observation de caractéristiques que l'on ne contrôle pas, les notions de variables indépendantes et dépendantes sont plus floues. En général, on tentera de déceler une corrélation entre deux variables, c'est-à-dire un lien plus ou moins strict entre les variations de l'une et de l'autre. Dans ce cas, la variable dépendante sera celle dont on croit que la valeur dépend de celle de l'autre variable; dans certains cas, cette causalité s'imposera d'elle-même, mais pas dans d'autres. Par exemple, si on trouve un lien entre la température et la taille des plantes, c'est sûrement cette dernière qui est la variable dépendante. Mais la chose est moins évidente si on observe un lien entre le poids des membres d'un troupeau et la quantité de nourriture qu'ils consomment : difficile de dire où est la cause et où est l'effet...

Dans ces situations, il sera tout de même important de s'assurer que les autres paramètres qui pourraient jouer un rôle demeurent constants, quitte, si on ne peut agir sur eux, à contrôler leur valeur en ne retenant qu'une partie des observations.

[ sommaire ]

[ précédent ]

4.

Variables et choix du dispositif de présentation

Le choix du dispositif de présentation adéquat et la détermination de la structure qui convient est plus un art qu'une science exacte. Il fait intervenir plusieurs facteurs, certains liés au mode de diffusion (les lecteurs auront-ils le temps d'examiner en détail le dispositif), d'autres au nombre de valeurs, d'autres enfin aux caractéristiques des données que l'on souhaite mettre en évidence afin d'appuyer notre argumentation ou nos conclusions. Veut-on fournir une vue d'ensemble d'une série ou de plusieurs séries de valeurs? Veut-on comparer des valeurs au sein d'une même série, ou comparer les séries de valeurs entre elles? Désire-t-on illustrer la pertinence d'un modèle théorique prédisant la valeur des VD à partir de celle des VI?

Les dispositifs présentés dans cette partie du cours et les gabarits qui vous sont fournis pour les activités et travaux notés pourront vous servir de sources d'inspiration, à tout le moins pour constuire des dispositifs techniquement corrects. Le reste est une question d'expérience et de réflexion : plus on fait de graphiques, en se demandant à chaque fois si ce qu'on fait est à la fois utile et facile à interpréter, plus on s'améliore.

Il existe cependant quelques règles ou conventions qui font intervenir le type de variables dont on présente les valeurs.

Les tableaux et les diagrammes

-

Sont employés surtout avec des VI qualitatives ou quantitatives discrètes.

-

Peuvent afficher un nombre maximal de valeurs, au-delà duquel ils deviennent beaucoup moins efficaces.

-

S'ils comprennent plus d'une VI (donc plusieurs séries de valeurs correspondant à chaque valeur ou combinaison de valeurs des autres VI), il faut choisir l'ordre des VI, donc le mode de regroupement des valeurs en série, en tenant compte du fait que les comparaisons deux-à-deux sont beaucoup plus aisées entre des éléments (nombres ou barres) contigus.

Les graphiques

-

Sont employés lorsqu'au moins une des VI est quantitative (continue ou discrète).

-

Peuvent afficher des séries (associées à chaque valeur ou combinaison de valeurs des autres VI) en nombre limité, mais chacune peut comprendre un très grand nombre de valeurs.

-

Conviennent pour mettre en évidence des tendances et des corrélations, c'est-à-dire des liens simples (du point de vue mathématique) entre les variables, de même que pour juger de l'adéquation d'un modèle.

  

[ sommaire ]