Cours ISI - Graphiques

From Isiwiki

(Redirected from Cours ISI - graphiques)
Jump to: navigation, search
^ Cours ISI - Principes ergonomiques


Cette partie peut être nommée "sur les traces de Tufte". E. Tufte est l'auteur d’un excellent livre sur la représentation des données. « The visual Display of Quantitative Information » Ed. Graphics Press – 1983 dont nous recommandons la lecture. Nous allons définir l'excellence graphique, l'intégrité graphique. Ensuite, nous montrerons des mauvais exemples. Et nous regarderons comment maximiser le rapport donnée- Encre. Pour finir, nous examinerons les graphiques multi-fonctionnels. Une bonne représenation graphique est une invitation à penser avec les yeux.

Contents

[edit] Excellence graphique

Selon E. Tufte :

« Les graphiques doivent communiquer avec clarté, précision et efficience des idées complexes ». Ceci amène les réfexions suivantes sur les graphiques:

  • représenter les données; Le graphique doit montrer "quelque chose" dans les données. Il doit mettre en évidence un fait qui sera analyser dans le texte accompagnant le graphique.
  • induire le lecteur à penser au fond (pas le distraire avec la forme); Le graphique doit être minimaliste et non décoratif.
  • éviter de distordre le propos des données; Le graphique ne doit pas manipuler le lecteur.
  • présenter beaucoup de nombres sur une petite surface; L'oeil est sensible à une petite discontinuité dans un ligne, pour voir le même événement dans un tableau de chiffres. Il faut lire les chiffres, effectuer des différences, un ensemble d'opérations où le cerveau est peu performant!
  • rendre cohérent les grands ensembles de données; Ceci prend toute son importance quand il s'agit de représenter plusieurs variables intervenant dans un même phénomène.
  • inviter l’œil à comparer les données; Toujours et encore!
  • couvrir le détail et l’ensemble; Ceci est l'idéal. On devrait voir les arbres et la forêt, L'idée étant de rien cacher au lecteur.
  • avoir un objectif clair (description, exploration, explication, …); Son usage et sa conception sont conditionnés par l'objectif.
  • être intégrer avec les autres descriptions (textuelles, statistiques); Le graphique soutient une analyse ou est une invitation à constater un phénomène.

[edit] L'approche statistique

En utilisant des données et appliquant sur celles-ci des opérateurs statistiques, on obtient parfois d'étranges résultats. Avec les données de Ascombe ("Graphs in Statistical Analysis" -American Statistician Feb. 1973).

Il apparaît que les 4 séries sont indentiques par rapport au x indicateurs statistiques. Elles partagent:

  • la même moyenne
  • le même coefficient de corrélation
  • le même écart type en X et Y
  • le même modèle de régression linéaire

tout indiquerait que les 4 séries sont issues d’un même modèle ?

[edit] L'approche graphique

En utilisant ces mêmes données représentées graphiquement. La question du même modèle ne se pose pas! Et immédiatement, on peut donner les interprétation suivantes:

  • La série 1 est un nuage de points qui peut accepter une régression linéaire (bien que sur le début les deux groupes de 3 points alignés présage peut être quelque chose de plus complexe).
  • La série 2 montre que la droite n'est pas un bon modèle pour cette courbe.
  • La série 3 montre que la droite est un bon modèle. Mais que sans doute qu'une erreur de mesure perturbe la régression linéaire.
  • La série 4 montre que la droite n'est pas un bon modèle (plusieurs mesures pour un même point)

[edit] Ses graphiques proches

Dans l'exemple précédent, on voit bien la capacité des graphiques à mettre en évidence les données. Par contre, les graphiques ne montrent que les données. Et si les données sont bizarres alors on obtient des graphiques bizarres.

Sur le graphique ci-dessus, l'auteur a posé cote à cote les courbes concernant les cours de bourse de New-York et la quantité de rayons solaire reçus pour la même période. Etrangement pour cette période, on peut y voir une correspondance. Il faut cependant savoir que pendant les années trente, un courant d'explication scientifique "naturiste" est très présent et que la bourse est expliquée avec un cycle de 11 et 9 ans, comme celui des tâches solaires. L'économiste E.L Smith tentera de prouver ce cycle de 11 ans sans succés!

[edit] Des exemples d'excellence graphique

[edit] carte des vents

Edmond Halley n'est pas seulement celui qui donnera son nom à une comète, il est aussi l'auteur de la première carte météo (1686). Sur sa carte, la force des vents est indiquée par la longueur des traits qui donnent la direction. Le sens est suggéré par le délié du trait (de plume?). (Ceci n'est qu'un extrait de la carte qui couvre le globe en entier)

[edit] modélisation de l'atmosphère terreste

  • carte /température /pression / direction du vent / vitesse du vent
  • noter l’usage des couleurs complémentaire
  • la répétition des cartes et des échelles

(from IBM ex de data-explorer)

[edit] ligne de train entre Paris et Lyon

  • arrêt
  • durée des stationnements en gare
  • vitesse des trains (pente)
  • croisement sur la ligne
  • faire des calculs (retard => translation)

(from E. Tufte - E.J. Marey 1885)

[edit] le Chômage est lié à l'inflation (La fin d’une croyance) ?

Ce genre de graphique met fin à tout un courant de pensée!

(from E. Tufte - Paul McCracken -1977)

[edit] Le graphique est narratif

  • Le graphique représente une collection de données. L'auteur du graphique qui étudien cette collection de données à des objectifs et des interprétations sur les données. Le graphique doit refléter ces dernières.
  • Le graphique met en oeuvre le minimum d’encre sur une surface par rapport aux données à représenter. Une notion d'économie et de dépouillement sont mis en oeuvre pour faire émerger ce qu'il faut voir.
  • Le graphique raconte au lecteur une histoire:
    • de rupture / rapprochement
    • de coévolution de variables
    • illustration d'idées
    • de variation au cour du temps
    • d'évolution d'un phénomène

Cette narration doit respecter le lecteur sans le manipuler.

[edit] Intégrité graphique

Une expérience: nous avons représenter un certain nombre de grandeurs par des symboles à une et deux dimensions. Ces symboles ont été agrandi proportionnellement au grandeurs à représenter. Il est certain que les symboles à deux dimensions ont un effet plus puissants que ceux à une dimension. Le stimuli est plus puissant car il croit comme la surface (carré de la longueur).


La représentation des nombres doit donc être proportionnelle à la surface qu’ils occupent. Les libellés doivent être clairement indiqués pour éliminer toute ambiguïté.

Ne pas satisfaire ces règles est une étape pour manipuler ou abuser le lecteur. On peut en déduire un facteur d'abus (FA) qui est le ratio entre l'effet dans le graphique et l'effet dans les données.

                    Effet dans le graphique
Facteur d’abus=------------------------------------
                    Effet dans les données


On visera donc un FA qui vaut 1.

Mécanismes de distorsion:

  • perspective
  • surface/longueur
  • volume
  • couper le zéro
  • mélanger les mesures

[edit] Exemple:perspective – log

du New York Time,9/8/78 (from Tufte). Ici la mise en scène, des données sur une route avec un point de fuite, modifie complètement le rapporte des longueurs!

Effet dans les données : objectif 53% d’économie de 78 à 85 Effet dans le graphique : effet de 783% (en mesurant les longueurs) Facteur abus= 14.8 !

Le même graphique sans abus !


[edit] Exemple: Perspective – changement de base en x

du New York Time,19/12/78 (from Tufte). L'effet de mise en avant pour Zoomer sur la dernière période modifie les propotions!

Finalement, on a 5 échelles verticales différentes ! Facteur abus=15.1

Le même graphique sans abus !

correction: attention au passage trimestriel, ici on choisit de modifier l'échelle en x, en indiquant clairement les trimestres.

[edit] La représentation de petites variations

La représentation de petites variations est toujours un problèmatique. Si l'on représente les valeurs en entier (sans effacement du zéro), on montre que rien ne bouge! Si l'on efface le zéro, on montre de grande variation! En renormant la valeur (avec une base 100, pour la première valeur), il est possible de montrer les variations en %. La dernière solution est de montrer les variations.

[edit] Utilisation des figures ou symboles

R. Satet, Les graphiques – Paris 1932 (from Tufte). Les figures doivent être mesurées en terme de surface (calculer le facteur d’abus pour le graphe suivant)

Le même graphique sans abus !

Pour les illustrateurs, les figures et les mises en scènes peuvent représenter des pièges par rapport à l'intégrité des données.

[edit] Le contexte est important

On ne peut pas détacher les données de leur contexte. Il faut donc faire de même pour les graphiques.

  • On ne peut pas tirer de conclusion sur deux points !
  • Que se passe-t’il avant ?
  • Que se passe-t’il après?

Il faut donc étendre le contexte!

[edit] ajouter des données avant et après

On voit qu'en ajoutant des données, pour une même variation de 2004 à 2005, on a des interprétations différentes. Dans le premier exemple, il d'agit d'une variation périodique. Dans le deuxième, la vairiation est le passage d'un palier à un autre. Dans le dernier, il s'agit d'un phènomène passager et unique.

[edit] étendre le contexte (à d'autres données)

En ajoutant des données (en rapport avec notre sujet!), on peut mieux juger de la pertinence de l'interprétation.


[edit] une étude de cas

On a pris une illustration sur la production du Pétrole dans Le Monde 2001.jpg

Les barils sont-ils correctement représentés ? Nous avons mesuré la hauteur des barils, nous avons normalisé toutes les informations à 1 pour la plus petite. Nous avons ensuite examiné le facteur d'abus en fonction de la hauteur ou de la surface.

On peut dire que le graphiste a bien respecter les données bien que le moyen-orient mériterait un baril bien plus important!

On a reporté dans un tableu les effets entre chiffres, hauteur et surface ainsi que le facteur d'abus.

On a comparé les données sans distorsion et avec la distorsion introduite par le graphiste.


Pas de doute les réserves du moyen-orient sont sous-représentées!

[edit] principes de l’intégrité

On peut résumer les principes d'intégrité graphique par les points suivants:

  • les hauteurs et les surfaces sont proportionnelles aux quantités à représenter
  • les libellés sont clairs afin d'éviter les ambiguïtés
  • montrer les variations dans les données
  • dans les séries temporelles, rapporter à un indice si c'est possible.
  • le nombre de dimensions du graphique ne doit pas dépasser le nombre de dimensions des données
  • le graphique ne doit pas « citer » des données hors de leur contexte

L'élégance du graphique évite les surcharges :

  • Les Moirés (hachures)
  • Le 3D
  • Les couleurs
  • Les Cadres
  • Rien à montrer
  • Les mises en scène


[edit] Mauvais exemples : moirés

Les moirés créent des illusions optiques et fatiguent l'oeuil.

From tufte – Rio de Janeiro 1929

[edit] Mauvais exemples : 3D

Souvent l'utilisation de la 3D n'est pas nécessaire. Le nombre de dimension des données est inférieure à 3

De plus la 3D apporte des distortion et une surcharge visuelle.

Mauvais exemples : 3D From tufte – American Education 1970

somme =100 !

[edit] Mauvais exemples : le quatre quarts financier

Conseil placement - Le Revenu - No 6015 jan 2001

Dans cet exemple, on trouve comme information:

  • dans le premier cercle = 25/25/25/25
  • dans le second cercle= 14 nombres

et on utilise la 3D ...

[edit] Mauvais exemples : arôme artificiel

Parfum - Marianme No 199-fev2001

  • 3 échelles pour les périodes : 1990-2000, 1999-2000, 2000
  • utilisation de la 3D
  • perspective …

[edit] peu de données = pas de graphique

From Tufte – Mary Eleanor Spear Charting statistic 1952. Au fond, seul le libellé est nécessaire.

impact - Le Revenu - No 6015 janv 2001. Ici aussi avec trois hypothèses, on génére seulement trois valeurs. Alors pourquoi un graphique!

[edit] le Ratio Encre-Données (RED)

On doit maximiser le Ratio Encre-Données (RED)

                    Encre consacrée aux données
RED  	= ------------------------------------------------
                   Total de l’encre utilisée dans la figure
       = proportion utilisée à de l’information
       = 1 – proportion utilisée à la décoration


Le RED du graphique suivant est excellent.

From Tufte – John Tyler Bonner Princeton, 1965 (RED 90% - guide de la grille, cadre)

Examinons des cas extrèmes de RED

[edit] Encre 1: RED = 0%

Ici le papier millimétré devient prépondérant et masque complètement la ligne du graphe

From Tufte – in American Political Science review 1967

(RED 0% - grille)

[edit] Encre 2: RED = 70%

From Tufte – in The Quantitative Analysis of Social Problems 1970

(Mêmes données que encre1 : RED 70% - grille)

[edit] Encre 3: Information = 0%

From Tufte – in Public Opinion and Politics 1970

(Mêmes données que encre1 : Il n’y a plus d’information)


On peut dégager 2 principes :

  • effacer raisonnablement les « décorations »
  • effacer raisonnablement les informations redondantes

[edit] les graphiques avec Excel

La décoration y est trop facile ! Le RED devient donc petit !


Excel : solution

  • Eliminer les cadres
  • Eliminer les grilles (griser)
  • Eliminer les couleurs pêtantes
  • … Rester simple, montrer les données

On traitant ce graphe, on obtient


On peut remarquer que la version office 2007 présente directement des graphiques de bonnes qualités (RED, choix des couleurs, ...)

[edit] Graphiques multi-fonctionnels

(From Tufte – Charles Joseph Minard – 1845-1869)


[edit] Encore des exemples de graphiques

4 états utilisés sur une échelle de 12 !

From La France agricole 8/2001

Graphiques : exemple

From La France agricole 8/2001

Personal tools