Traitement d'erreurs retour à la liste des howto linux

21. Traitement d'erreurs

Contenu de cette section

Les fonctions open, ioctl, write et read peuvent renvoyer des erreurs. Dans ce cas, leur valeur de retour est -1 et la variable globale errno est positionnée au numéro d'erreur (négatif). Les valeurs de errno sont définies dans /usr/include/errno.h. Les valeurs négatives possibles sont les suivantes :

Fonction | Erreur       | Description
=========|==============|==================================================
open     |  ENXIO       | peripherique invalide
         |  EACCES      | l'acces n'est pas en lecture/ecriture (O_RDWR)
         |  EBUSY       | le peripherique est accede en mode non bloquant,
         |              | mais il est occupe actuellement
         |  ERESTARTSYS | erreur interne. Essayez de la rendre reproductible
         |              | et informez-en le canal SCSI (pour les details sur
         |              | le rapport de bogue, se reporter au SCSI-HOWTO de
         |              | Drew Eckhardts).
ioctl    |  ENXIO       | peripherique invalide
read     |  EAGAIN      | le peripherique bloque. Essayez plus tard.
         |  ERESTARTSYS | erreur interne. Essayez de la rendre reproductible
         |              | et informez-en le canal SCSI (pour les details sur
         |              | le rapport de bogue, se reporter au SCSI-HOWTO de
         |              | Drew Eckhardts).
write    |  EIO         | taille trop petite (plus petite que cette de l'en-
         |              | tete generique). Attention : il n'y a actuellement
         |              | aucun controle de debordement.
         |  EAGAIN      | le peripherique bloque. Essayez plus tard.
         |  ENOMEM      | la memoire necessaire pour cette requete ne peut
         |              | etre allouee. Essayez plus tard sauf si vous depas-
         |              | sez la taille maximale de transfert (cf. ci-dessus).
select   |              | sans description
close    |              | sans description

Pour la lecture et l'écriture, des valeurs de retour positivent indiquent comme d'habitude la quantité d'octets transférés. Cette valeur doit correspondre à celle demandée.

21.1 Décodage de l'état d'erreur

En plus, une information détaillée est fournie par hd_status du noyau et par sense_buffer du périphérique (cf. section ref id="sec-sensebuff" name="Le tampon SCSI">), les deux utilisant la structure d'en-tête générique.

Les différents sens de hd_status peuvent être trouvés dans drivers/scsi/scsi.h. Cet unsigned int est composé de différentes parties :

  lsb  |    ...    |    ...    | msb
=======|===========|===========|============
status | sense key | host code | driver byte

Les macros de drivers/scsi/scsi.h sont disponibles, mais elles ne peuvent malheureusement pas être facilement utilisées à cause d'interdépendances tordues entre fichiers d'en-tête. Il faudrait faire une passe sur ces fichiers pour clarifier les choses.

        Macro          | Description
=======================|=================================================
status_byte(hd_status) | Etat du peripherique. cf. section Codes d'etat
msg_byte(hd_status)    | du peripherique. cf. section buffer SCSI
host_byte(hd_status)   | du noyau. cf. section codes hote
driver_byte(hd_status) | du noyau. cf. section codes intermediaires

21.2 Codes d'état

Les codes d'état de périphérique qui suivent (issus de drivers/scsi/scsi.h) sont disponibles :

Valeur | Symbole
=======|=====================
0x00   | GOOD
0x01   | CHECK_CONDITION
0x02   | CONDITION_GOOD
0x04   | BUSY
0x08   | INTERMEDIATE_GOOD
0x0a   | INTERMEDIATE_C_GOOD
0x0c   | RESERVATION_CONFLICT

On constate que ces valeurs symboliques ont subi un décalage droit. Lorsque l'état indique CHECK_CONDITION, les données du buffer SCSI sont valides (contrôlez en particulier le code d'état additionnel et le qualificateur de code d'état additionnel).

Les valeurs qui suivent concernent les spécifications SCSI-2 :


                  Table 27 : Code de l'octet d'etat
+=================================-==============================+
|      Bits de l'octet d'etat     |  Etat                        |
|  7   6   5   4   3   2   1   0  |                              |
|---------------------------------+------------------------------|
|  R   R   0   0   0   0   0   R  |  GOOD                        |
|  R   R   0   0   0   0   1   R  |  CHECK CONDITION             |
|  R   R   0   0   0   1   0   R  |  CONDITION MET               |
|  R   R   0   0   1   0   0   R  |  BUSY                        |
|  R   R   0   1   0   0   0   R  |  INTERMEDIATE                |
|  R   R   0   1   0   1   0   R  |  INTERMEDIATE-CONDITION MET  |
|  R   R   0   1   1   0   0   R  |  RESERVATION CONFLICT        |
|  R   R   1   0   0   0   1   R  |  COMMAND TERMINATED          |
|  R   R   1   0   1   0   0   R  |  QUEUE FULL                  |
|                                 |                              |
|       Tous autres codes         |  Reserve                     |
|----------------------------------------------------------------|
|       R = Bit reserve                                          |
+================================================================+

La définition des codes de l'octet d'état sont données ci-dessous :

GOOD.

Cet état indique que la cible a correctement exécuté la commande.

CHECK CONDITION.

Cet état indique qu'une condition de contention s'est produite (cf. 6.6).

CONDITION MET.

Cet état, ou INTERMEDIATE-CONDITION MET est renvoyé lorsque les conditions de l'opération demandée sont satisfaites (cf. commandes SEARCH DATA et PRE-FETCH).

BUSY.

Cet état indique que la cible est occupée. Il peut être renvoyé lorsque la cible ne peut accepter de commande depuis un initiateur inacceptable par ailleurs (i.e. conflit d'absence de réservation). L'action de reprise recommandée est une nouvelle tentative ultérieure.

INTERMEDIATE.

Cet état, ou INTERMEDIATE-CONDITION MET doit être renvoyée après chaque commande réussie d'une série de commandes liées (sauf pour la dernière), sauf si celle-ci se termine par un CHECK CONDITION, RESERVATION CONFLICT, ou COMMAND TERMINATED. Si ni INTERMEDIATE ni INTERMEDIATE-CONDITION MET n'est renvoyé, la série de commandes se termine, ainsi que le processus d'entrées/sorties.

INTERMEDIATE-CONDITION MET.

Cet état est la combinaison de CONDITION MET et de INTERMEDIATE.

RESERVATION CONFLICT.

Cet état doit être renvoyé lorsqu'un initiateur tente d'accéder à une unité logique ou à un extension à l'intérieur d'une unité logique réservée avec un type de réservation en conflit pour un autre périphérique SCSI (cf. commandes RESERVE et RESERVE UNIT). L'action de reprise recommandée est une nouvelle tentative ultérieure.

COMMAND TERMINATED.

Cet état doit être renvoyé lorsque la cible termine le processus d'entrées/sorties après réception d'un message TERMINATE I/O PROCESS (cf. 5.6.22). Cet état indique aussi qu'une condition de contention s'est produite (cf. 6.6).

QUEUE FULL.

Cet état doit être implémenté si la file d'attente marquée (tagged queuing) l'est aussi. Il est renvoyé lors de la réception d'un message SIMPLE QUEUE TAG, ORDERED QUEUE TAG, ou HEAD OF QUEUE TAG et que la file de commandes est pleine. Le processus d'entrée/sortie n'est alors pas placé dans la file de commandes.

21.3 Clefs du buffer SCSI

Les clefs résultantes peuvent être rapatriées à l'aide de la macro msg_byte (cf. section Décodage de l'état d'erreur ). Les symboles du noyau qui suivent sont prédéfinis dans drivers/scsi/scsi.h :

Valeur | Symbole
=======|================
0x00   | NO_SENSE
0x01   | RECOVERED_ERROR
0x02   | NOT_READY
0x03   | MEDIUM_ERROR
0x04   | HARDWARE_ERROR
0x05   | ILLEGAL_REQUEST
0x06   | UNIT_ATTENTION
0x07   | DATA_PROTECT
0x08   | BLANK_CHECK
0x0a   | COPY_ABORTED
0x0b   | ABORTED_COMMAND
0x0d   | VOLUME_OVERFLOW
0x0e   | MISCOMPARE

Une liste extraite de la doc SCSI-2 suit (issue de la section 7.2.14.3) :

        Table 69: Description des clefs (0h-7h) du buffer SCSI
+========-====================================================================+
|  Clef  |  Description                                                       |
|--------+--------------------------------------------------------------------|
|   0h   |  NO SENSE.  Indique qu'aucune information specifique n'est         |
|        |  disponible pour l'unite logique designee. C'est le cas pour les   |
|        |  commandes reussies ou celles dont l'etat est CHECK CONDITION ou   |
|        |  COMMAND TERMINATED a cause de l'un des bits filemark, EOM ou ILI. |
|--------+--------------------------------------------------------------------|
|   1h   |  RECOVERED ERROR.  Indique que la reussite de la derniere commande |
|        |  fut conditionnee par une action de reparation effectuee par la    |
|        |  cible. Les octets additionnels peuvent fournir des details, ainsi |
|        |  que le champ information. Lorsque plusieurs erreurs reparees se   |
|        |  produisent durant une commande, le choix de celle indiquee        |
|        |  (premiere, derniere, plus severe, etc.) depend du peripherique.   |
|--------+--------------------------------------------------------------------|
|   2h   |  NOT READY.  Indique que l'unite logique est inaccessible. Une     |
|        |  intervention manuelle peut etre necessaire.                       |
|--------+--------------------------------------------------------------------|
|   3h   |  MEDIUM ERROR.  Indique la fin d'une commande sur une erreur non-  |
|        |  recuperable, causee probablement par un defaut du support ou une  |
|        |  erreur de donnees. Cette clef peut aussi etre renvoyee si la      |
|        |  cible ne peut faire la distinction entre un defaut du support et  |
|        |  un defaut specifique du materiel (clef 4h).                       |
|--------+--------------------------------------------------------------------|
|   4h   |  HARDWARE ERROR.  Indique que la cible a detecte une erreur mate-  |
|        |  rielle irrecuperable (defaut du controleur, du peripherique, er-  |
|        |  reur de parite, etc.) lors de l'execution de la commande ou d'un  |
|        |  auto-test.                                                        |
|--------+--------------------------------------------------------------------|
|   5h   |  ILLEGAL REQUEST.  Indique qu'un parametre illegal a ete detecte   |
|        |  dans le bloc de description de commande ou dans les parametres    |
|        |  additionnels (pour certaines commandes : FORMAT UNIT, SEARCH DATA,|
|        |  etc.). Si la cible detecte un parametre incorrect, il doit termi- |
|        |  ner celle-ci sans modifier le contenu du support. Si le parametre |
|        |  incorrect se trouve dans les parametres additionnels, la cible    |
|        |  peut avoir deja modifie le support. Cette clef est aussi renvoyee |
|        |  lors de la reception d'un message IDENTIFY invalide (5.6.7).      |
|--------+--------------------------------------------------------------------|
|   6h   |  UNIT ATTENTION.  Indique que le support amovible a pu etre change |
|        |  ou que la cible a ete reinitialisee. Cf. 6.9 pour d'autres infor- |
|        |  mation sur cette condition.                                       |
|--------+--------------------------------------------------------------------|
|   7h   |  DATA PROTECT.  Indique qu'une commande de lecture ou d'ecriture a |
|        |  ete tentee sur un bloc protege contre cette operation. Celle-ci   |
|        |  n'est pas effectuee.                                              |
+=============================================================================+

        Table 70: Description des clefs (8h-Fh) du buffer SCSI
+========-====================================================================+
|  Clef  |  Description                                                       |
|--------+--------------------------------------------------------------------|
|   8h   |  BLANK CHECK.  Indique qu'un peripherique a ecriture unique ou     |
|        |  sequentiel a trouve un support vierge ou une indication de fin de |
|        |  donnees de formatage lors de la lecture, ou qu'un support non     |
|        |  vierge a ecriture seule a ete trouve pendant l'ecriture.          |
|--------+--------------------------------------------------------------------|
|   9h   |  Vendor Specific.  Cette clef est disponible pour indiquer des     |
|        |  cas particuliers specifiques du constructeur.                     |
|--------+--------------------------------------------------------------------|
|   Ah   |  COPY ABORTED.  Indique qu'une commande COPY, COMPARE ou COPY AND  |
|        |  VERIFY a echoue a cause d'une condition d'erreur sur le periphe-  |
|        |  rique source, destination ou les deux (cf. 7.2.3.2 pour plus de   |
|        |  details).                                                         |
|--------+--------------------------------------------------------------------|
|   Bh   |  ABORTED COMMAND.  Indique que la cible a abandonne la commande.   |
|        |  L'initiateur peut eventuellement corriger le probleme par une     |
|        |  nouvelle tentative.                                               |
|--------+--------------------------------------------------------------------|
|   Ch   |  EQUAL.  Indique qu'une commande SEARCH DATA a satisfait une con-  |
|        |  dition d'egalite.                                                 |
|--------+--------------------------------------------------------------------|
|   Dh   |  VOLUME OVERFLOW.  Indique qu'un peripherique a memoire-tampon a   |
|        |  atteint la fin de partition et que des donnees non ecrites sur le |
|        |  support peuvent rester dans le tampon. Une (ou plusieurs) commande|
|        |  RECOVER BUFFER DATA peut etre tentee pour lire les donnees non    |
|        |  ecrites depuis le tampon.                                         |
|--------+--------------------------------------------------------------------|
|   Eh   |  MISCOMPARE.  Indique que les donnees source ne correspondent pas  |
|        |  a celles lues sur le support.                                     |
|--------+--------------------------------------------------------------------|
|   Fh   |  RESERVE.                                                          |
+=============================================================================+

21.4 Codes hôte

Les codes hôtes qui suivent sont définis au niveau de drivers/scsi/scsi.h. Ils sont positionnés par le pilote du noyau et doivent être utilisés avec la macro host_byte (cf. section Décodage de l'état d'erreur ) :

Valeur | Symbole        | Description
=======|================|========================================
0x00   | DID_OK         | Pas d'erreur
0x01   | DID_NO_CONNECT | Connexion impossible avant le timeout
0x02   | DID_BUS_BUSY   | BUS occupe durant la periode de timeout
0x03   | DID_TIME_OUT   | Timeout atteint pour une autre raison
0x04   | DID_BAD_TARGET | Mauvaise cible
0x05   | DID_ABORT      | Arret effectue pour une autre raison
0x06   | DID_PARITY     | Erreur de parite
0x07   | DID_ERROR      | Erreur interne
0x08   | DID_RESET      | Reinitialise par quelqu'un
0x09   | DID_BAD_INTR   | Interruption inattendue recue

21.5 Codes du pilote

Le pilote de niveau intermédiaire catégorise l'état renvoyé par le pilote de bas niveau en fonction du buffer SCSI du périphérique. Il suggère certaines actions pouvant être tentées comme un réessai, un abandon ou un changement de topographie. La routine scsi_done de scsi.c effectue un travail très différencié fondé sur host_byte(), status_byte(), msg_byte() et la suggestion précédente. Ensuite, il positionne l'octet du pilote afin d'indiquer ce qui a été réalisé. L'octet du pilote est en deux parties : l'état du pilote et la suggestion. Chaque moitié est composée des valeurs suivantes (de scsi.h) combinées par un OR :

Valeur | Symbole        | Description ou etat du pilote
=======|================|========================================
0x00   | DRIVER_OK      | pas d'erreur
0x01   | DRIVER_BUSY    | inutilise
0x02   | DRIVER_SOFT    | inutilise
0x03   | DRIVER_MEDIA   | inutilise
0x04   | DRIVER_ERROR   | erreur interne du pilote
0x05   | DRIVER_INVALID | termine (DID_BAD_TARGET ou DID_ABORT)
0x06   | DRIVER_TIMEOUT | termine avec timeout
0x07   | DRIVER_HARD    | termine avec une erreur fatale
0x08   | DRIVER_SENSE   | buffer SCSI disponible pour informations

Valeur | Symbole        | Description de la suggestion
=======|================|========================================
0x10   | SUGGEST_RETRY  | reessayer la requete SCSI
0x20   | SUGGEST_ABORT  | abandonner la requete
0x30   | SUGGEST_REMAP  | remape le bloc (non encore implemente)
0x40   | SUGGEST_DIE    | laisser le noyau tomber en "panic"
0x80   | SUGGEST_SENSE  | lire le buffer SCSI du peripherique
0xff   | SUGGEST_IS_OK  | rien a faire


Chapitre suivant, Chapitre Précédent

Table des matières de ce chapitre, Table des matières générale

Début du document, Début de ce chapitre