User Tools

Site Tools


ipm:humain

L'humain

Card, Morgan et Newell (1983) proposent un modèle dit du processeur humain qui conceptualise de manière simplifiée le processus humain lors d'une phase interactive avec un système informatique. Dans ce modèle, le processeur humain est composé de trois sous-systèmes :

Le système sensoriel (perceptif) comprend la vision, l'audition, l'odorat, le système haptique (toucher et mouvement). Il s'occupe de transmettre les perceptions au système cognitif.

Le système cognitif est composé de la mémoire perceptive, de la mémoire de travail (à court terme), de la mémoire à long et court terme, et de tout ce qui permet le compréhension, le raisonnement, la construction de modèles mentaux, d'objectifs, d'intentions, etc.

Le système moteur permet au système au système cognitif de diriger tous les mouvements du corps (déplacer la main, plier un doigt, etc.)

Le système sensoriel

La vision

L'oeil est composé d'un certain nombre d'éléments pour capter la lumière et la transformer en signaux électriques transmis au cerveau via le nerf optique. Le cerveau analyse ce signal et l'interprète. Grâce au travail du cerveau nous sommes capables de distinguer un grand nombre de couleurs, de différencier les formes et de percevoir le mouvement et la profondeur.

La couleur

La perception de la couleur résulte de la combinaison des signaux envoyés par les récepteurs appelés cône, de type S, M et L sensibles respectivement dans le bleu, le vert et le rouge.

Par exemple, une lumière jaune, de longueur d'onde 580nm, stimulera fortement les cônes M et L mais pas du tout les cônes S. Le cerveau recevra donc 3 signaux : 2 forts et un nul, à partir desquels in créera la perception du jaune.

Remarquons que si l'oeil reçoit simultanément de la lumière rouge et de la lumière verte il enverra exactement les mêmes signaux au cerveau qui percevra par conséquent une couleur jaune. Le jaune pur ou le jaune résultant de l'addition de rouge et de vert ne sont donc pas distinguables par le cerveau. C'est pourquoi il suffit des trois couleurs de base rouge, vert, bleu pour engendrer la perception de toutes les couleurs du spectre visible (ce qui facilite bien la vie des constructeurs d'écrans).

Le contraste

Le contraste est la mesure de la différence entre la luminance de deux couleurs. La luminance est la somme pondérée des intensités du rouge (R), vert (V) et bleu (B). Elle s'obtient par la formule L = 0,299 R + 0,587 G + 0,114 B. Pour qu'une information soit lisible sur un fond, elle doit avoir un contraste suffisant, en particulier si l'utilisateur souffre d'un déficit visuel.

Ci-dessous différents cas de contrastes. Le premier nombre est la luminance du fond, le second celle du texte. Une plus grand différence de luminance rend le texte plus lisible.

Couleurs et émotions

L'emploi d'une couleur peut induire certaines émotions chez l'utilisateur. Selon Boyle (2002) les utilisateurs des pays occidentaux interprètent les couleurs de la manière suivante

  • rouge: danger, excitation, feu, passion
  • bleu: calme, vérité, constance, fiabilité, puissance
  • noir: raffinement, élégance, puissance, rébellion, mort
  • blanc: pureté, propreté, luminosité, vide
  • jaune: chaleur, luminosité, joie, soleil
  • vert: nature, frais, végétation, santé

Harmonie des couleurs

On sait que certaines combinaisons de couleurs sont perçues comme plus harmonieuses que d'autres.

Les graphistes ont développé de nombreuses techniques pour obtenir des ensembles de 2, 3, 4 ou plus couleurs perçus comme harmonieux. Celles-ci sont en général basées sur les positions des couleurs dans un cercle chromatique. Différents schémas : couleur opposée, triangle équilatéral, triangle isocèle, rectangle, carré, etc. permettent d'obtenir des ensembles possédant différentes types d'harmonie. Des sites tels que http://colorschemedesigner.com/ proposent des outils interactifs pour les création de schémas de couleur harmonieux.

L'audition

D'un point de vue purement physique, l'audition se base sur la réception d'onde acoustique. Ces ondes sont provoquées par la propagation d'une vibration mécanique du milieu (e.g., l'air). Une source sonore résulte donc de l'interaction physique entre plusieurs objets de l'environnement. Par exemple, le carillonnement d'une cloche a pour origines le choc du battant sur les parois.

Les vibrations mécaniques sont ensuite reçues par l'oreil, puis transmises au cerveau par les nerfs auditifs. Du point de vue physiologique, comme l'illustre la figure ci-dessous (à mettre), l'oreille se compose de trois parties : l'oreille externe, l'oreille moyenne et l'oreille interne. L'oreille externe est à la fois une structure de protection et de résonnance. Elle comprend le pavillon et le conduit auditif. Le pavillon capte et concentre les vibrations sonores qu'il fait transiter le long du conduit auditif pour atteindre la partie de l'oreille moyenne. L'oreille moyenne est une petite cavité reliée d'un côté au tympan et de l'autre à l'oreille interne par la cochlée. Elle est constituée par trois os : le marteau l'enclume et l'étrier. Leur rôle est d'amplifier les vibrations captées par le tympan. Les vibrations transitent finalement à l'intérieur du canal cochléaire se situant dans l'oreille interne. Ce canal rempli de liquide, est muni de fines cellules ciliées sur toute la longueur. Ces cellules, en fonction des vibrations du liquide cochléaire, libèrent un flux chimique qui active le nerf auditif.

Communément appelé “son”, ce dernier peut être définit par une courbe mathématique périodique. Un son dont la courbe est uniquement définit par une sinusoïde est appelé ton pur. La majorité des sons cependant sont composés de plusieurs sinusoïdes de fréquences et d'amplitudes différentes. On appelle ces sons “tons complexes”. La sinusoïde constituant un ton complexe dont la fréquence est la plus basse se nomme fondamentale. Le reste des sinusoïdes est appelé harmoniques.

Psychoacoustique

D'un point de vue perceptif, le son est caractérisé par trois paramètres distincts : la hauteur, l'intensité et le timbre. La hauteur correspond à la fréquence du son. Dans le cas où le son représente un ton complexe, la hauteur correspond à la fréquence de sa fondamentale. L'être humain est capable de percevoir des sons dans une bande passante comprise entre 50 à 20'000 Hz. L'intensité sonore correspond au volume du ton. Elle est déterminée par l'amplitude maximum de sa courbe. Ce paramètre est souvent exprimé en dB ou “pression acoustique”. Un son dont la pression acoustique est supérieur à 100 dB peut provoquer chez l'homme des dommages irréversibles du système auditif. Finalement, le timbre représente le “sens” du son (sa sémantique). Il est défini par l'enveloppe de la courbe. C'est grâce au timbre que nous pouvons faire la distinction entre le son d'un piano de celui d'un hautbois.

De nombreuses recherches en psychoacoustique ont eu pour but d'étudier les phénomènes perceptifs liés à l'audition chez l'humain. Deux des plus connus sont la perception de scènes auditives et l'audition spatiale.

Le système cognitif

La mémoire

La mémoire, ou plus exactement les mémoires, font partie du système cognitif.

La mémoire à court terme est capable d'enregistrer immédiatement un élément. Mais sa capacité est limitée à environ 5 symboles. De plus, l'enregistrement a une brève durée de vie. C'est la mémoire à court terme qui nous permet de nous souvenir pendant un bref instant d'un numéro de téléphone, du titre d'un livre, etc.. Cette limite de la mémoire à court terme est importante pour la conception des interfaces. Le concepteur ne doit, par exemple, pas faire l'hypothèse qu'une information lue il y a trois minutes est encore présente à l'esprit de l'utilisateur. Si, lors d'une interaction avec la machine, l'utilisateur doit, à un instant donné, avoir plus de 5 symboles en mémoire, une phénomène de surcharge cognitive apparait. Du coup, l'utilisateur est fortement perturbé : il se met à faire des erreurs, ou bien il recourt à des aides externes (noter des informations sur un bout de papier) ce qui gêne son travail, il peut même se retrouver complètement bloqué.

La mémoire à long terme possède au contraire une capacité énorme et les informations peuvent y rester durant toute la vie. En contrepartie, l'enregistrement dans cette mémoire peut demander énormément de temps et d'efforts. C'est ce problème d'enregistrement qui rend les interfaces de type ligne de commande très difficiles à maitriser. L'utilisateur débutant doit en permanence se référer au guide d'utilisation, jusqu'à ce qu'il ait appris par coeur la liste des commandes du système.

Modèle mental

Le modèle mental est le modèle de la réalité (la vision) qu'une personne construit dans sa tête. Comme tout modèle il s'agit d'une simplification de la réalité qui doit néanmoins être suffisante pour agir (voir survivre) dans le monde. Peu de gens pourrait décrire précisément comment fonctionne le gestionnaire de fichiers d'un ordinateur. Cependant, les utilisateurs de traitement de texte s'en font une idée suffisante pour ouvrir, fermer, enregistrer, copier des fichiers.

Une bonne interface devra favoriser la constitution d'une image mentale du système “suffisamment correcte” chez l'utilisateur.

Apprentissage

L'apprentissage humain est un domaine extrêmement vaste et complexe, que nous ne saurions aborder ici. En ce qui concerne les interfaces il est utile de mentionner quelques points

Toute interface nécessite forcément un apprentissage, même une interface dite intuitive n'est en fait qu'une interface dont le temps d'apprentissage est très court.

Toute activité possède une courbe d'apprentissage («learning curve»). Partant de l'observation que élus on répète cette activité, plus on devient efficace, on peut dessiner, pour une activité donnée, une courbe décroissante indiquant le temps que prend l'exécution de l'activité en fonction du nombre de répétitions. Idéalement la courbe d'apprentissage d'une interface devrait décroitre rapidement, signifiant que l'utilisateur passe facilement du stade de débutant à celui d'expert. Buxton fait remarquer qu'il ne faut pas chercher à faire des interfaces faciles à utiliser pour un débutant mais viser à rendre le l'utilisateur expert aussi rapidement que possible.

L'apprentissage peut être renforcé par des indications, des guides, des codes de couleurs, etc. qui à priori ne sont pas considérés comme nécessaires. Par exemple, l'indication des raccourcis clavier à côté des éléments de menus ou les «tool tips» qui apparaissent lorsqu'on approche le pointeur d'un élément d'interface. La consistance de l'interface, dont nous parlerons au chapitre \ref{chap:ergo} est aussi un élément clé de l'apprentissage.

La qualité des aides en ligne et des manuels est évidemment cruciale. Un bon manuel doit aider l'utilisateur à se construire un modèle mental du système qui soit satisfaisant, c'est-à-dire un modèle qui lui permette de comprendre ce qui se passe et quel sera l'effet de ses actions.

Système sensori-moteur

Le système sensori-moteur est responsable du contrôle des postures, des mouvements ainsi des forces exercées sur les objets. Il s'agit du couplage entre les facultés sensorielles et motrices du cerveau. Lorsqu'on tient un objet dans la main les capteurs de pression de la peau informent le cerveau qui, en retour, dirige les muscles des doigts pour qu'ils exercent des forces nécessaires pour le maintenir en place tout en veillant à ne pas l'écraser.

Ce système est évidemment mis à contribution lors de l'interaction homme-machine vu que l'utilisateur doit percevoir ce que la machine lui transmet (visuellement, auditivement, etc.) et transmettre lui-même des information à la machine par son action tactile (taper sur un clavier), gestuelle (positionner une souris, bouger devant une caméra, …) ou vocale.

La désignation d'un objet sur un écran est typique de la coordination sensori-motrice. L'utilisateur perçoit visuellement la position du pointeur (flèche) sur l'écran et de la cible, il en déduit le mouvement à faire avec la main sur la souris pour rapprocher le pointeur de la cible. Et ainsi de suite jusqu'à ce que la cible soit atteinte.

Loi de Fitts

La loi de Fitts met en relation la distance et la taille d'un objet cible et le temps nécessaire pour déplacer un pointeur vers cet objet. Cette loi, découverte par Fitts dans les années 1950 a été reprise avec succès dans le domaine de l'IHM. De manière générale, la loi dit que le temps moyen MT nécessaire pour atteindre la cible s'obtient par la formule

MT = a + b × ID

où a et b sont des constantes déterminées empiriquement (par des séries de mesures avec différents utilisateurs et différentes distances et tailles de cibles) en fonction de l'appareil de pointage (souris, joystick, flèches du clavier, etc.) et ID est l'indice de difficulté. Dans sa forme originale ID est défini comme

ID = log2(2D/W+1)

où D est la distance entre le point d'origine et le centre de l'objet visé, W est la largeur de la cible (on travaille sur une seule dimension) et log2 est le logarithme en base 2 1) .

Pour des cibles à deux dimensions, (macke03) proposent la formule

ID = log2(D/min(W,H) + 1)

où W est la largeur et H la hauteur de la cible.

Cette loi indique que le temps de pointage croît avec la distance à parcourir et la petitesse de la cible. Cependant cette croissance est logarithmique en base 2, ce qui signifie qu'un doublement de la distance (ou une division par 2 de la taille) ne modifie ID, et donc le temps, que d'une unité. Par conséquent, si l'on veut diminuer sensiblement le temps de pointage il faut réduire considérablement la distance ou augmenter largement la taille de la cible.

1) log2(x) est la puissance à laquelle il faut élever 2 pour obtenir x. On peut calculer log2(x) à partir du logarithme naturel (ln) ou du logithme en base 10 (log) par la formule log2(x) = ln(x)/ln(2) = log(x)/log(2)
ipm/humain.txt · Last modified: 2013/06/12 17:35 by gilles