PCA et PRA — Plan de Continuité et de Reprise d'Activité
Le PCA (Plan de Continuité d'Activité) et le PRA (Plan de Reprise d'Activité) sont deux plans complémentaires qui permettent à une organisation de faire face à une crise majeure (cyberattaque, sinistre, pandémie, panne critique...) et de s'en remettre.
PCA vs PRA : quelle différence ?
| PCA | PRA | |
|---|---|---|
| Objectif | Maintenir l'activité pendant la crise | Rétablir l'activité après la crise |
| Paradigme | "Ne jamais s'arrêter" | "Redémarrer le plus vite possible" |
| Technologie | Redondance, basculement automatique (failover) | Restauration depuis sauvegardes |
| Coût | Élevé (infrastructure dupliquée) | Modéré (selon les RPO/RTO) |
| Exemples | Cluster HA, site de secours actif/actif | Restauration Veeam, site de secours à froid |
Un bon dispositif combine les deux : le PCA prend le relais immédiatement et le PRA structure la remontée complète en cas d'échec du PCA ou de sinistre total.
PCA — Plan de Continuité d'Activité
Concept
Le PCA vise à maintenir les fonctions essentielles de l'organisme même en cas de défaillance majeure. Il repose sur :
- L'identification des activités critiques (BIA — Business Impact Analysis)
- La mise en œuvre de solutions de redondance techniques et organisationnelles
- Des procédures de basculement (failover) définies, testées et documentées
BIA — Analyse d'Impact sur l'Activité
Avant de rédiger un PCA, il faut réaliser un BIA pour répondre à ces questions :
| Question | Réponse attendue |
|---|---|
| Quelles activités sont critiques ? | Liste des processus métier essentiels |
| Quel est l'impact d'une interruption ? | Financier, réglementaire, réputationnel |
| Pendant combien de temps peut-on s'arrêter ? | Définit le RTO |
| Jusqu'à quelle date peut-on perdre des données ? | Définit le RPO |
Indicateurs clés
| Indicateur | Définition | Exemple |
|---|---|---|
| RTO (Recovery Time Objective) | Durée maximale d'interruption tolérable | RTO = 4h → le service doit être rétabli en 4h |
| RPO (Recovery Point Objective) | Perte de données maximale acceptable | RPO = 1h → sauvegarde toutes les heures |
| MTPD (Maximum Tolerable Period of Disruption) | Durée max avant impact irréversible | MTPD = 24h → au-delà, l'organisme ne s'en remet plus |
Architectures de continuité
graph LR
subgraph "Site Principal"
P["⚙️ Prod Active"]
end
subgraph "Site de Secours"
S1["🔴 Cold Standby\n(RTO: heures/jours)"]
S2["🟡 Warm Standby\n(RTO: minutes/heures)"]
S3["🟢 Hot Standby\n(RTO: secondes)"]
end
P -- "Réplication asynchrone" --> S1
P -- "Réplication semi-sync" --> S2
P -- "Réplication synchrone" --> S3
| Mode | Délai de basculement | Coût |
|---|---|---|
| Cold Standby | Heures à jours | Faible |
| Warm Standby | Minutes à heures | Modéré |
| Hot Standby (Actif/Passif) | Secondes | Élevé |
| Actif/Actif | Quasi immédiat | Très élevé |
PRA — Plan de Reprise d'Activité
Concept
Le PRA est le plan "d'urgence" qui décrit comment restaurer les services après un sinistre lorsque le PCA ne peut plus maintenir l'activité (sinistre total, ransomware chiffrant le site principal et le site de secours...).
Il s'appuie essentiellement sur la politique de sauvegarde et définit : * L'ordre de priorité de restauration des systèmes * Les procédures techniques de restauration * Les responsables et leurs suppléants * Les contacts d'urgence (prestataires, hébergeurs, assureurs cyber...)
Ordre de priorité de restauration
- Infrastructure de base : Active Directory, DNS, DHCP — sans eux, rien ne fonctionne
- Messagerie et communication : La coordination de crise en dépend
- Systèmes métier critiques : ERP, DPI (santé), applicatifs de facturation
- Systèmes secondaires : Intranet, outils collaboratifs, archives
- Postes de travail utilisateurs
Cellule de crise
Un PCA/PRA efficace prévoit une cellule de crise activée dès le début de l'incident :
| Rôle | Responsabilité |
|---|---|
| DSI / Directeur de crise IT | Coordination technique globale |
| RSSI | Qualification de l'incident, interface avec les autorités (ANSSI, CNIL) |
| Référents métier | Priorisation des besoins fonctionnels |
| Communication | Messages internes et externes, gestion de la réputation |
| Juridique | Obligations légales (notification CNIL sous 72h si données personnelles) |
Tester le PCA/PRA
[!IMPORTANT] Un plan non testé est un plan qui ne fonctionnera pas en cas de crise. L'ANSSI recommande des exercices réguliers.
- Test de sauvegarde/restauration : Valider que les sauvegardes sont exploitables
- Test de basculement : Simuler la perte du site principal et le basculement sur le site de secours
- Exercice de table : Simulation de crise avec la cellule de crise (sans impact technique)
- Test grandeur nature : Bascule réelle en dehors des heures de production