Feuille de route

Licence Creative Commons

Le contenu de ce site est diffusé sous licence Creative Commons Paternité-
Pas d'utilisation commerciale Canada

C7 - Les graphiques

Sommaire

1.

Introduction

2.

Les graphiques à une variable dépendante (VD)

3.

Les graphiques à deux variables dépendantes (VD)

4.

Courbes théoriques et valeurs mesurées

5.

Les graphiques de dispersion

  

[ sommaire ]

[ suivant ]

1.

Introduction

Les graphiques sont employés quand au moins une des VI est quantitative (continue ou discrète) et, idéalement, qu'elle compte au moins une dizaine de valeurs.

Ils conviennent particulièrement :

-

pour illustrer une tendance, c'est-à-dire de quelle façon la VD varie en fonction de la VI, éventuellement pour chaque valeur ou combinaison de valeurs de la ou des autres VI;

-

pour estimer l'adéquation d'un modèle mathématique, théorique ou empirique, décrivant la relation entre la VD et la ou les VI; ce modèle étant représenté par une ou des courbes sur le graphique;

-

pour déterminer s'il y a une corrélation entre deux variables, dont on ne sait pas a priori si l'une est liée à l'autre, ou l'influence.

Les graphiques sont aussi très utiles pour mettre en évidence des anomalies, par exemple, une valeur s'écartant de façon exagérée de ce que suggère l'allure générale des résultats ou le modèle mathématique.

Dans un graphique, chaque couple de valeurs de la variable indépendante (VI), ou d'une combinaison de VI, et de la variable dépendante (VD) est représenté par un point. Lorsque l'on désire afficher les incertitudes sur la valeur des variables, on les représente par des rectangles d'incertitude, qui sont en fait des lignes dont les longueurs indiquent les grandeurs de l'incertitude, selon l'échelle de chaque axe (figure 1b). Dans les cas particuliers (mais fréquents) où l'incertitude sur une des variables est négligeable ou trop faible pour être visible à l'échelle du graphique, le rectangle se réduit à une simple ligne verticale (figure 1a) ou horizontale (figure 1c).

Figure 1 Rectangles d'incertitude, avec incertitude : sur la VD seulement (a), sur les deux variables (b) et sur la VI seulement (c).

Les caractéristiques d'un graphique dépendent du nombre et du type de variables qu'il contient.

Passons donc en revue les principaux types de graphiques. Veuillez noter que, les quantités représentées sur les graphiques sont des données simulées, sauf mention contraire (dans ce cas, elles sont tirées de la thèse de doctorat de l'auteur).

  

[ sommaire ]

[ précédent ]

[ suivant ]

2.

Les graphiques à une variable dépendante (VD) 

Le graphique le plus simple (figure 2) est celui qui ne comprend qu'une seule variable dépendante (VD) et une seule variable indépendante (VI). Ici, il y a en fait deux autres VI (la variété et la dose), mais on ne cherche pas à illustrer leur influence.

Figure 2. Taille des plants de la variété Glory en fonction de l'âge, dose optimale. [Exemple de graphique à 1 VI et 1 VD]

Le cadre dans lequel sont affichés les points est appelé fenêtre des données. Les côtés de celle-ci, appelés axes, portent des divisions et sous-divisions. Ces divisions, qui doivent être en nombre restreint (normalement entre 3 et 6), affichent des nombres (appelés étiquettes) couvrant la gamme des valeurs des variables.

Par convention, la VI est portée sur l'axe horizontal (ou abscisse) et la VD sur l'axe vertical (ou ordonnée). Le nom et les unités de chaque variable sont affichés au centre de l'axe correspondant. Si l'on préfère ne pas tourner le nom de la VD, on peut aussi afficher celui-ci au-dessus du coin gauche de la fenêtre de données, à l'horizontale.

Afin d'éviter que des points ne risquent d'être masqués, les divisions et sous-divisions sont placées à l'extérieur de la fenêtre des données, et les extrémités de celle-ci dépassent les valeurs extrêmes des variables.

Pour mettre en évidence la progression des valeurs, on peut relier les points successifs par des segments de droite, comme dans la figure 3a, ou encore tracer des courbes régulières, appelées courbes de tendance, passant le plus possible au voisinage des points (figure 3b).


a)


b)

Figure 3. Mêmes données qu'à la figure 2. [Exemples de graphiques à 1 VI et 1 VD avec points reliés (a) et courbe de tendance (b)]


Ces segments et ces courbes ont pour but de faciliter la perception des tendances; un trait plus épais que celui du cadre et des divisions est normalement employé.

Un graphique permet d'afficher sans problème un très grand nombre de couples de valeurs de variables, comme l'illustre la figure 4, qui compte plus d'une centaine de points. La présence de segments reliant les points est essentielle dans ce type de graphique, soit lorsque les valeurs de la VD présentent des fluctuations rapides mais que celles de la VI sont régulièrement espacées (quand la VI est le temps, on parle dans ce cas de série chronologique).

On remarquera en outre le recours à une échelle verticale logarithmique qui met en évidence les fluctuations aux faibles intensités, concentrées près du centre et des bords du faisceau. Une échelle logarithmique est employée quand la valeur maximale est telle que les différences entre les plus petites valeurs que l'on veut représenter deviennent peu perceptibles. Elle est utile aussi lorsqu'on désire effectuer des comparaisons en pourcentage, car des distances égales le long de l'axe logarithmique correspondent à des pourcentages égaux de variation.

Vous remarquerez que des droites pointillées ont été tracées dans la fenêtre des données. Elles indiquent des valeurs de référence utiles à la lecture du graphique. Ici, on a choisi la position zéro et deux positions symétriques par rapport à celle-ci, ce qui permet de visualiser plus facilement l'asymétrie de la distribution.

Figure 4 Intensité d'un faisceau en fonction de la position horizontale (données réelles). [Exemple de graphique de type série chronologique avec points reliés]


Lorsqu'une des valeurs dépasse très largement les autres, ou encore que celles-ci se concentrent en deux ou trois groupes distincts relativement éloignés, il peut être utile d'interrompre carrément un axe pour sauter à une nouvelle valeur, avec ou sans changement d'échelle. Cette procédure peut d'ailleurs être employée à la place d'une échelle logarithmique.

Une telle interruption doit être fortement signalée. Une bonne façon de le faire est de juxtaposer plusieurs fenêtres des données nettement séparées. Ce procédé est très utile pour mettre en évidence certaines parties du graphique. Ainsi, pour les mêmes données qu'à la figure 4, un double changement d'échelle (vertical et horizontal; voir figure 5) donne un meilleur aperçu de la partie centrale du graphique, qui apparaît dans sa propre fenêtre des données. Remarquez qu'aucune échelle logarithmique n'a été employée.

Figure 5 Mêmes données qu'à la figure 4. [Exemple de graphique de type série chronologique, avec fenêtre scindée en trois, avec changement d'échelle]


Les valeurs d'une seconde variable indépendante (qualitative ou quantitative discrète) peuvent être représentées sur le même type de graphique (figure 6) par le recours à des points de formes et de teintes différentes associées aux valeurs de cette seconde VI.

 

Figure 6. Taille des plants de la variété Glory en fonction de l'âge,,
méthodes actuelle et optimale. [Exemple de graphique à 2 VI et 1 VD avec points reliés]

Dans ce type de graphique, les traits ou courbes de tendance sont très utiles pour distinguer les séries, surtout lorsque qu'elles ne sont pas bien séparées, comme dans la figure 6. Il convient alors d'utiliser pour chaque série de traits et de points un style différent. Pour les graphiques en couleurs, on choisira évidemment la même couleur pour les points et les traits; pour les graphiques destinés à l'impression ou la photocopie, il est suggéré de ne pas employer de tons de gris, mais de distinguer les points par leur forme, en alternant pour chaque forme entre les variantes noire et blanche, et les traits par le type de pointillé, comme dans la figure 7.

Figure 7. Coefficient de restitution de sphères de divers matériaux en fonction de la vitesse d'impact. [Exemple de graphique à 2 VI et 1 VD avec 4 séries et courbes de tendance]

Au-delà de quatre ou cinq séries, ou encore lorsque les séries empiètent trop les unes sur les autres, il peut être préférable de recourir à des fenêtres des données juxtaposées verticalement, contenant chacune une seule série et comportant des axes horizontaux identiques.

  

[ sommaire ]

[ précédent ]

[ suivant ]

3.

Les graphiques à deux variables dépendantes (VD)

Lorsqu'il y a deux VD possédant des gammes de valeurs, voire des unités différentes, on peut associer chacun des deux axes verticaux à l'une d'elles (figure 8), en indiquant bien à quelle série de points correspond chaque axe.

Figure 8. Taille et masse des feuilles en fonction de l'âge des plants. [Exemple de graphique à 1 VI et 2 VD, avec double échelle]


Dans ce type de graphique, lorsqu'on désire comparer l'importance des variations relatives (en pourcentage) des deux VD, il est conseillé de faire partir les deux axes de zéro, ou encore de choisir le même rapport maximum-minimum pour les deux échelles. En effet, comme le montre la figure 9, par le simple jeu d'un changement du rapport maximum/minimum des échelles, on peut donner l'impression que n'importe quelle des deux VD varie beaucoup plus que l'autre en fonction de la VI.


a)


b)


c)

Figure 9. Taux de consommation d'électricité et d'eau en fonction de la température. [Trois versions d'un graphique à 1 VI et 2 VD à double échelle. Dans les deux premiers (a et b), le rapport maximum-minimum des échelles diffère pour les deux axes verticaux]

Ainsi, le premier graphique (figure 9a) suggère que le taux de consommation moyenne d'électricité augmente beaucoup plus que le taux de consommation d'eau avec la température, alors que le second (figure 9b), qui présente exactement les mêmes données, suggère plutôt l'inverse. Le troisième graphique (figure 9c), dont le rapport maximum-minimum est le même (soit 2) pour les deux axes verticaux, montre bien que les deux VD varient sensiblement du même pourcentage en fonction de la VI dans l'intervalle représenté.

  

[ sommaire ]

[ précédent ]

[ suivant ]

4.

Courbes théoriques et valeurs mesurées

Lorsqu'on associe un modèle mathématique au phénomène représenté par les données, les courbes théoriques correspondantes sont tracées sur le graphique (voir figure 10 et fenêtre du haut du graphique de la figure 11), de la même façon que les courbes de tendance. Cependant, à la différence des courbes de tendance, qui n'ont pour but que de guider l'œil en lui fournissant un repère, les courbes théoriques représentent les valeurs prédites ou fournies par le modèle.

La nature du modèle et, si possible, la valeur des paramètres qui lui permettent de bien représenter le phénomène doivent être mentionnées dans le texte, la légende ou même à l'intérieur de la fenêtre des données. Dans l'exemple de la figure 10, le texte fournirait l'équation où figure le paramètre a dont les valeurs sont indiquées dans le graphique.

Figure 10. Vitesse d'un chariot en fonction du temps, avec ou sans charge de 10 kg. [Exemple de graphique avec courbes théoriques et affichage des paramètres du modèle]


Si l'on veut mettre davantage en évidence l'adéquation (ou la divergence) entre le modèle et les points expérimentaux, on peut juxtaposer au graphique présentant les valeurs mesurées et la courbe théorique un graphique des différences qui, comme son nom l'indique, affiche la différence entre les valeurs mesurées et celles que fournit le modèle. Ce type de graphique sert à distinguer les écarts aléatoires dus à l'incertitude sur les mesures des écarts plus globaux qui traduisent la tendance des valeurs mesurées, dans certaines régions du graphique, à s'écarter du modèle.

C'est ce qu'on a fait dans la figure 11, où l'on a tracé dans le graphique des différences une courbe de tendance qui permet de bien distinguer les écarts globaux dans diverses parties de la distribution et les variations aléatoires (rapides) dues à l'incertitude sur les mesures, de même que les régions où celle-ci semble plus importante. Remarquez également que, comme dans la figure 4 et la figure 5 des droites pointillées indiquent des valeurs de référence (valeurs zéro et valeur moyenne).

Figure 11. Haut : intensité mesurée d'un faisceau en fonction de la position horizontale (données réelles) et courbe théorique correspondante (gaussienne avec w = 0,38 cm). Bas : différence entre intensité mesurée et intensité théorique. [Exemple de comparaison expérience-modèle à l'aide d'un graphique des différences]

   

[ sommaire ]

[ précédent ]

5.

Les graphiques de dispersion

Les graphiques de dispersion (appelés aussi nuages de points, scatter plots en anglais) sont des graphiques où, contrairement à tous les graphiques illustrés plus haut :

-

les valeurs d'aucune des deux variables n'ont été choisies ou fixées (également espacées, par exemple) durant l'expérimentation ou l'observation;

-

plusieurs valeurs d'une variable peuvent être associées à une même valeur de l'autre.

Il arrive même qu'il soit impossible de déterminer quelle variable est la VI, ou même si l'une dépend de l'autre. Les deux variables peuvent en effet se révéler complètement indépendantes, ou encore afficher un lien (ou corrélation) dû simplement le fait qu'elles dépendent toutes deux d'une troisième variable, non considérée, qui est la véritable VI.

La figure 12 illustre un grand nombre de mesures (environ 400) du taux moyen d'activité de fourmis et de la température moyenne au cours de la journée, pour un grand nombre d'individus et de jours. Bien que le taux d'activité varie significativement pour une température donnée (c'est ce qu'on entend par dispersion) on perçoit bien une tendance régulière à l'augmentation de l'activité en fonction de la température, tendance soulignée par la droite inclinée qui traverse le graphique (générée, justement, par la fonction « courbe de tendance » d'Excel). Dans ce cas précis, les variables forment bien un couple VI-VD, car il est très plausible de conclure que le taux d'activité varie en fonction de la température, l'inverse étant évidemment impossible.

Figure 12. Taux d'activité quotidien des fourmis en fonction de la température moyenne. [Exemple de graphique de dispersion à 1 VI et 1 VD]

Un tel graphique peut également accommoder une seconde VI, discrète, si celle-ci ne comporte que peu de valeurs. On emploie alors des types de points différents (forme et teinte) pour distinguer les valeurs de cette VI. La figure 13 illustre les mêmes données que la précédente, mais en indiquant de quelle colonie, parmi les quatre étudiées, provenait chaque individu.

Figure 13. Taux d'activité quotidien des fourmis en fonction de la température moyenne, selon la colonie à laquelle elles appartiennent. [Exemple de graphique de dispersion à 2 VI et 1 VD]

On constate que les fourmis de la colonie D se distinguent des autres : sur toute l'étendue de la gamme de températures, les fourmis les plus actives appartiennent à cette colonie.

Note. Toutes les figures de cette page sont des copies d'écran de graphiques réalisés avec Excel, en utilisant les gabarits fournis dans le cours.

  

[ sommaire ]

[ précédent ]