La gestion des incidents est le processus qui consiste à gérer un ou plusieurs évènements malheureux imprévus qui interrompent un système ou un service.
Le but de cet article est de vous proposer un processus de gestion des incidents en 7 étapes pour vous aider à mieux contrôler la situation en cas de pépin.
Qu'est-ce qu'un incident ?
Un incident, tel que défini par le référentiel ITIL, est un évènement nuisible qui vient perturber le cycle de vie d’un système, service ou une organisation donnée.
Et, que ce soit dans la routine des activités d’une entreprise ou dans le cycle de vie d’un projet, un incident peut vite arriver.
Exemple :
Considérons, une entreprise de livraison, qui s’engage sur des délais avec ses clients.
Le fait que, par exemple, un camion qui soit en train d’aller livrer un client, ait brusquement une crevaison de pneu, est un incident.
Et c’est un type d’incident qui peut être fréquent dans la routine des activités de cette entreprise.
Qu'est-ce que la gestion des incidents ?
La gestion des incidents désigne le processus par lequel on tente de gérer un ou plusieurs évènements nuisibles imprévus qui viennent perturber le cycle de vie d'un système ou d'un service.
Incident vs problème
Il ne faut pas confondre un incident et un problème.
Un incident est l’effet d’un problème. En d’autres termes, un problème est la cause d’un ou plusieurs incidents.
Aussi, le processus de gestion des incidents diffère de la gestion des problèmes.
La gestion des problèmes met un accent plus important sur la prévention, parce qu’un problème peut être dans un état latent, c’est-à-dire qu’il n’a pas encore causé d’incident.
Revenons par exemple sur le cas présenté plus haut : la panne du camion, pendant qu’il est sur un circuit de livraison.
Le problème à la base de cet incident peut être la vétusté des pneus ou l’insuffisance du mécanisme de contrôle avant les départs de camions.
Dans l’exemple ci-dessus, gérer le problème, permet de mieux prévenir une crevaison de pneu.
Alors que réparer une crevaison, c’est résoudre un incident.
Pourquoi est-il important de gérer les incidents ?
La gestion d'incident est un élément important dans l’organisation d’une structure ou même d’un projet.
C’est pourquoi, pour mieux la maîtriser, il est recommandé de définir un plan ou un processus de gestion d'incidents.
Cette procédure a pour objectifs de :
- Bâtir une démarche cohérente pour faire face à tout type d’incident
- Résoudre rapidement et efficacement les incidents
- Gérer la communication et l’engagement des parties prenantes pendant la crise liée à l’incident
- Avoir des statistiques fiables sur les incidents récurrents
- Avoir une base de connaissances sur les traitements appliqués aux incidents
Les 7 étapes de la gestion des incidents
J’ai identifié 7 étapes clés à prendre en compte dans la définition d’un bon processus de gestion des incidents.
Chacune de ces étapes sera décrite dans les sections ci-après :
1) Identifier l’incident
La première étape, c’est la déclaration de l’incident.
Il s’agit là de savoir qu’il y a un incident, et le prendre en charge, pour traitement.
Il est conseillé d’élaborer une fiche de déclaration d’incident qui sera mise à disposition des usagers.
Cette fiche peut être reproduite dans un outil de gestion d'incidents, pour plus d’automatisation.
2) Définir et classifier un incident
Après avoir été notifié de l’incident, il faut maintenant le qualifier.
Il s’agit ici de classifier l’incident selon un ordre de priorité.
La priorité peut être définie sur le niveau d’impact de l’incident, la population concernée, les effets cascades, etc.
Imaginons un incident de panne d’électricité dans une usine : c’est toute la production qui s’arrête, les ventes seront par conséquent impactées, etc.
Un tel incident, ne sera pas classifié au même niveau de priorité avec un incident lié à l’imprimante de l’agent comptable qui a une panne.
C’est pourquoi, il existe généralement trois niveaux de priorité classiques pour les incidents :
- « Haute »
- « Normale »
- « Basse »
L’organisation devra définir les types d’incidents par priorité.
Par exemple, on peut considérer que les incidents de priorité « Haute » sont ceux qui provoquent un arrêt total de la productivité, et ainsi de suite.
3) Recueillir les preuves et enquêter
Relever les preuves et les faits, est une marche importante sur l’escalier qui mène à la résolution de l’incident.
L’idée, c'est de collecter tous les points d’impacts de l’incident.
Cette étape aide également à circonscrire l’incident et limiter les conséquences.
4) Analyser les causes
Il s’agit de remonter à la racine de l’incident pour identifier les causes exactes et profondes.
Un incident dont la vraie cause n’a pas été identifiée, peut être mal résolue.
Et l’incident peut ressurgir à nouveau après peu de temps.
Prenons un exemple :
Supposons un incident qui consiste en l’arrêt du système de froid sur un dispositif de climatisation.
Un premier niveau de diagnostic peut relever qu’il n’y a plus de gaz dans le circuit.
Mais si, on s’arrête juste à cette analyse sans comprendre ce qui a provoqué l’insuffisance du gaz, on peut compléter le niveau de gaz, en pensant résoudre l’incident.
Cependant, derrière cet incident, la véritable cause pourrait être la perforation d’un tuyau, qui provoque une fuite de gaz.
Si on résout seulement l’incident, en ne remettant que le gaz, le même incident se reproduira, de façon imminente.
5) Résoudre l'incident
C’est l’étape de la résolution effective de l’incident.
Cela consiste à appliquer le traitement adéquat pour éliminer l’incident.
Il peut arriver que cette étape fasse l’objet de plusieurs escalades entre intervenants pour aboutir à la solution définitive.
Le processus de gestion des incidents doit prendre en compte tous les niveaux d’escalade éventuels.
6) Vérifier la résolution
Le traitement appliqué pour résoudre l’incident doit être testé.
Ce n’est pas une étape toujours requise, mais fortement recommandée.
Elle permet de s’assurer que c’est bien le bon traitement qui a été appliqué.
7) Clôturer l’incident et enrichir votre base de connaissances
Une fois la vérification de la résolution effectuée, il faut marquer l’incident comme étant clos.
C’est l’étape finale.
Suite à cela, la base de connaissances de l’organisation doit être enrichie avec les données suivantes :
- le problème à la source de l’incident
- les impacts négatifs de l’incident
- les traitements appliqués pour résoudre l’incident
- les personnes et/ou leur profil, ayant travaillé à la résolution de l’incident
- le délai de résolution en précisant :
- le temps écoulé entre la déclaration de l’incident et sa prise en charge
- le temps mis entre la prise en charge et la résolution
- le temps effectué entre la résolution et la clôture
Ces données pourraient constituer un bon rapport de gestion d'incidents.
En effet, toute clôture d’incident doit être soldée par un rapport.
Gérer l’engagement des parties prenantes pendant l’incident
Il est important d’identifier les parties prenantes concernées et de gérer leur engagement tout le long de la procédure de gestion de l’incident.
Les acteurs clés impactants et impactés par l’incident doivent être continuellement informés de toutes les actions menées dans la gestion de la crise.
La politique de gestion des incidents doit inclure un plan de communication qui devrait contenir à minima :
- Les canaux de communication
- La fréquence des communications
- Les types d’évènements qui doivent générer des notifications ou des alertes aux différents acteurs
Modèle de Plan de Communication Projet
Avec une étude de cas concrète
Quels sont les statuts d’un incident ?
Pendant ces étapes, l’incident doit passer par plusieurs statuts, et cela doit être clair pour chaque partie prenante concernée.
1) Statuts de base
Les différents statuts ou états d’un incident dans son cycle de vie sont :
- Incident déclaré
- Incident pris en charge
- Incident en cours de résolution
- Incident résolu
- Incident clos
Voyons ci-après la signification de chacun de ces statuts pour chacune des étapes de gestion des incidents sus-mentionnées :
Statut de l’incident | Description | Étapes de gestion de l'incident |
---|---|---|
Déclaré | L’incident est identifié et a fait l’objet de notification | Étape 1 : Identifier l’incident |
Pris en charge | Les acteurs en charge de la résolution de l’incident ont démarré leurs investigations | Étape 2 : Définir l’incident |
En cours de résolution | La résolution de l’incident est initiée et la recherche de solution est en cours | Étape 3 : Recueillir les preuves et enquêter |
Résolu | La solution est trouvée et appliquée. L’incident est résolu | Étape 6 : Vérifier la résolution |
Clos | La solution est testée et on est sûr que c’est la bonne. Tout est OK. L’incident est maintenant clos | Étape 7 : Clôturer l’incident et enrichir votre base de connaissances |
Il existe des outils de gestion des incidents qui permettent de suivre, de façon plus dynamique, chacun de ces statuts.
2) Statuts intermédiaires
De plus, il faut comprendre que selon le contexte, il peut exister des statuts intermédiaires qui sont présentés comme suit :
- En attente : L’incident est pris en compte, mais sa résolution est retardée par des facteurs externes.
Toutefois, dans un tel cas, l’hémorragie éventuellement provoquée par l’incident devrait d’abord être maitrisée, pour en limiter les dégâts.
Par exemple : Mettre le processus de résolution d’un incident en attente, peut s’avérer nécessaire quand on a un SLA serré à respecter. La mise en attente, met le chronomètre en pause. - Traitement temporaire ou Solution non éprouvée : Il peut arriver qu’on ne sache pas exactement la bonne solution à l’incident. Dans ce cas, on essaie des solutions intermédiaires, quitte à fournir un service dégradé aux usagers.
Statut de l’incident | Description |
---|---|
En attente | L’incident est pris en compte, mais sa résolution est retardée par des facteurs externes. |
Traitement temporaire ou Solution non éprouvée | Il peut arriver qu’on ne sache pas exactement la bonne solution à l’incident. Dans ce cas, on essaie des solutions intermédiaires, quitte à fournir un service dégradé aux usagers. |
Conclusion
La gestion des incidents est une compétence importante de management, et encore plus quand il s’agit de mener un projet à son terme, en qualité de chef de projet.
Le but de cet article a été de vous aider à adopter une bonne méthode de gestion du cycle de vie des incidents.
N'hésitez pas à partager vos avis et questions dans les commentaires ci-dessous.