Plan de Continui
Plan de Continui
Plan de Continui
: CAS DE
LA DIRECTION GENERALE
Le plan de continuité de l’activité est un document qui décrit la stratégie à adopter pour faire
face, selon leur priorisation, à des risques identifiés, selon la probabilité de leur survenance et
la gravité de leur impact. Il s’agit d’un document qui définit des procédures et les ressources
associées.
La mise en place et le maintien du PCA se réalisent en six étapes successives. Ces six étapes
sont plus ou moins difficiles à mettre en œuvre, car elles nécessitent à chaque fois la
participation de plusieurs intervenants ainsi que la validation de la direction du groupe.
a- Définition du périmètre
Cette étape consiste à définir le périmètre des actifs critiques (activités et processus,
organisations et infrastructures) de l’entreprise à maintenir démarré en priorité en cas
d’incident ou de sinistre. Pour chacune de ces activités (applications informatiques et/ou
processus), une Durée Maximale d’Interruption Admissible (DMIA), également connu sous le
nom de Recovery Time Objective (RTO) et une Perte de Données Maximale Admissible
(PDMA) connu sous le nom de Recovery Point Objective (RP) vont être définis. La
DMIA/RTO peut se traduire par la durée maximale d’interruption d’un service offert aux
usagers que l’on juge admissible avant que l’entreprise n’en supporte des effets trop lourds, en
terme financier ou d’image de marque. La PDMA/RPO représente la durée maximum
d’enregistrement des données qu’il est acceptable de perdre, c’est-à-dire le temps qui s’est
écoulé depuis que la dernière sauvegarde a été réalisée. Il convient donc de se poser les
questions suivantes, pour calculer une DMIA et une PDMA : DMIA : Pendant combien de
temps pouvons-nous supporter de nous passer de telle application et/ou tel processus. Par
exemple, pendant combien de temps pouvons-nous supporter qu’un client n’ait pas accès à la
partie support/web du groupe et donc accès à la gestion de ses tickets. PDMA : De combien
de temps doit dater la dernière sauvegarde qui a été réalisée, pouvons-nous supporter de
perdre par exemple, les 4 dernières heures de travail, les 8 dernières heures de travail, etc.
donc plus le RPO est faible, plus la fréquence de sauvegarde des données devra être rapide.
Pour mener la réflexion plus en avant, plusieurs paramètres ont été également pris en compte
et un croisement de ces paramètres a été effectué. La criticité d’une application, une liste des
différents types de risques auxquels ces applications sont soumises, un niveau d’impact de ces
risques, une évaluation de la probabilité et de la récurrence de ces évènements et donc un
niveau d’importance qu’un risque fait courir sur notre qualité de service.
Direction Générale
Département social et juridique
Direction commerciale :
Service logistique
Service commande
Service stock
Service vente
Direction administrative :
Service finance
Service Ressource Humaine
Service achat
Service comptabilité
Service audit
Direction technique :
Service informatique
Service froid et climatisation
Service entrepôt
Service génie civil
Service chariot
Service infirmerie
Service garage
Secrétariat
a- Mesures préventives
Viennent ensuite, par ordre décroissant de citations, les solutions de réplication, mirroring et
secours multi-sites ou sur un autre site distant, de basculement sur un réseau de secours,
d’analyse de procédures et stratégies assurant la continuité de business, de gestion de bande
passante, de sécurité physique et logique…
Il s'agit de disposer d'un système informatique équivalent à celui pour lequel on veut limiter
l'indisponibilité : ordinateurs, périphériques, systèmes d'exploitation, programmes particuliers,
etc. Une des solutions consiste à créer et maintenir un site de secours, contenant un système
en ordre de marche capable de prendre le relais du système défaillant. Selon que le système de
secours sera implanté sur le site d'exploitation ou sur un lieu géographiquement différent, on
parlera d'un secours in situ ou d'un secours déporté.
Voici les différentes solutions de sites de secours, de la moins coûteuse à la plus coûteuse :
• Les salles blanches, appelées également « sites froids » Il s’agit d’une salle vide, prête à
recevoir le matériel informatique en cas de déclenchement du plan de reprise.
• Les salles oranges, appelées également « sites tièdes » Une salle orange est un intermédiaire
entre une salle blanche et une salle rouge. Dans une salle orange, seuls les serveurs, dédiés
aux applications les plus critiques du SI, sont déjà présents et prêts à fonctionner.
• Les salles rouges, appelées également « sites chauds » Dans le cas d’une salle rouge, tous les
équipements nécessaires à la reprise du SI, sont présents et prêts à fonctionner. Par contre,
selon les choix technologiques mises en œuvre en matière de sauvegarde et de stockage
(sauvegarde à distance, journalisation à distance, ou réplication asynchrone), les données
applicatives seront disponibles plus ou moins rapidement en cas de besoin.
• Les salles miroirs Une salle miroir est similaire à une salle rouge, sauf que dans le cas d’une
salle miroir, les données applicatives sont disponibles instantanément, grâce à un mécanisme
de réplication synchrone. On distingue deux catégories de salles miroirs. Soit la salle miroir
est passive et ne traite aucune donnée de production. Elle ne devient active qu’en cas de
déclanchement du plan de continuité informatique. Soit elle est pleinement active, et la
production est partagée en permanence entre les deux sites. Le choix technologique, entre ces
différents moyens, doit être fait, en fonction de la durée d’indisponibilité tolérée par le SI.
Bien entendu, cela peut varier d’une application à une autre, et des choix différents peuvent
cohabiter au sein d’un même PCI.
Plus les temps de rétablissement garantis sont courts, plus la stratégie est coûteuse. Il faut
donc choisir la stratégie qui offre le meilleur équilibre entre le coût et la rapidité de reprise.
Il est aussi possible de recourir à un site secondaire de haute disponibilité qui se situe
généralement près du site de production (moins de 10 kilomètres) afin de permettre de les
relier avec de la fibre optique et synchroniser les données des deux sites en quasi temps réel
de manière synchrone ou asynchrone selon les technologies utilisées, les besoins et
contraintes techniques.
b- Mesures curatives
Selon la gravité du sinistre et la criticité du système en panne, les mesures de rétablissement
seront différentes.
Dans cette hypothèse, seules des données ont été perdues. L'utilisation des sauvegardes est
nécessaire et la méthode, pour simplifier, consiste à réimplanter le dernier jeu de sauvegardes.
Cela peut se faire dans un laps de temps court (quelques heures), si l'on a bien identifié les
données à reprendre et si les méthodes et outils de réimplantation sont accessibles et connus.
À un seuil de panne, plus important, une ou des applications sont indisponibles. L'utilisation
d'un site de secours est envisageable, le temps de rendre disponible l'application en cause.
Étape 1 : Étude du contexte. Tout PCA réussi prend en compte les spécificités de
l’entreprise en termes de style de pilotage et de politique de gestion des ressources
humaines et matérielles, ainsi que les contraintes liées à son secteur d’activité. On peut
ainsi dresser la liste des activités essentielles à l’activité de l’organisation, et apprécier
le niveau de risque acceptable.
Étape 2 : Définition de la durée d’indisponibilité acceptable et du niveau de service
minimum pour chaque activité.
Étape 3 : Identification des scénarios de crise prioritaires. Il faut quantifier l’impact
des risques selon leur nature, avec comme critères la probabilité d’occurrence et la
gravité de l’incident. Cette démarche permet de savoir quelles menaces sont les plus
critiques pour l’entreprise, et d’identifier les actions de prévention et de protection
indispensables.
Étape 4 : Liste des moyens et procédures à mettre en œuvre. Le but est de pouvoir
continuer à utiliser des réseaux et matériels en cas de sinistre ; il peut s’agir de
ressources non-affectées par la crise ou de ressources externes. Les données critiques
doivent être dupliquées pour garantir une disponibilité maximale.
Étape 5 : Rédaction du plan. Le document décrit en détail les réponses aux différents
scénarios de crise. Les personnes qui jouent un rôle dans ces procédures doivent être
clairement identifiées. Le texte doit être clair, afin de pouvoir être compris par des
personnes qui n’ont pas encore été formées.
Étape 6: Contrôle et évolution du plan. Le PCA n’est pas un document figé : il doit
évoluer pour répondre aux changements de l’organisation. Des dispositifs de
vérification et de contrôle permettent de s’assurer de son efficacité et des points à
repenser.