IT-Lexikon
DRPCybersecurity

Disaster Recovery Plan

Technisch detaillierter Plan zur Wiederherstellung von IT-Systemen, Anwendungen und Daten nach einem Ausfall oder Sicherheitsvorfall — innerhalb definierter RTO- und RPO-Vorgaben.

Der Disaster Recovery Plan (DRP) ist das technische Drehbuch, mit dem die IT-Abteilung im Ernstfall Systeme, Anwendungen und Daten wiederherstellt. Während der Business Continuity Plan das Geschäft als Ganzes betrachtet und der IT-Notfallplan die organisatorische Koordination im Notbetrieb regelt, beschreibt der DRP konkret, welche Server in welcher Reihenfolge mit welchen Backups, welcher Konfiguration und welchen Verantwortlichen wieder online gebracht werden — innerhalb der durch RTO und RPO vorgegebenen Zeitfenster.

Inhalt eines vollständigen DRP

Ein belastbarer DRP geht weit über eine Backup-Liste hinaus. Er enthält priorisierte Wiederherstellungsreihenfolgen, technische Verfahren pro System, Abhängigkeitskarten zwischen Anwendungen sowie Eskalations- und Kommunikationswege. Typische Bestandteile:

Komponente Zweck
Asset- und Abhängigkeitsregister Welche Systeme hängen voneinander ab, welche müssen zuerst wiederhergestellt werden
Recovery-Prozeduren je System Schritt-für-Schritt-Anleitungen für Restore, Failover und Reintegration
Backup- und Replikationsstrategie Frequenz, Speicherorte, Aufbewahrungsdauer, Verschlüsselung
Alternative Infrastruktur Cold-, Warm- oder Hot-Site, Cloud-Failover, Ausweich-Hardware
Test- und Übungsplan Frequenz, Szenarien, Erfolgskriterien

Die Abhängigkeitskarten sind in der Praxis besonders wertvoll: Viele Wiederherstellungen scheitern nicht an fehlenden Backups, sondern daran, dass etwa eine Datenbank ohne den zugehörigen Authentifizierungsdienst gestartet wird.

DRP-Strategien und ihre Kosten

Die Wahl der DRP-Strategie ist immer eine Abwägung zwischen RTO-Anforderung und Investitionsvolumen.

Strategie Typisches RTO Charakteristik
Cold Site Tage Räumlichkeiten und Grundinfrastruktur, Systeme werden im Ernstfall aufgebaut
Warm Site Stunden Hardware vorhanden, Daten regelmäßig repliziert, Konfiguration aktualisierbar
Hot Site / Active-Active Minuten bis Sekunden Vollständig synchronisierte Spiegelumgebung mit automatischem Failover
Cloud-DR Minuten bis Stunden Wiederherstellung in Public Cloud, oft als pragmatischer Mittelweg

Cloud-basierte Disaster Recovery hat sich für mittelständische Unternehmen als attraktiver Mittelweg etabliert, weil die Vorhaltekosten geringer sind und die Skalierung im Ernstfall flexibel erfolgt.

Ransomware verändert die DRP-Anforderungen

Klassische DRPs gingen historisch von Brand, Hardwareausfall oder Naturkatastrophen aus. Ransomware-Angriffe haben dieses Bild grundlegend verändert: Moderne Erpresser-Gruppen löschen oder verschlüsseln gezielt Backups und nutzen Verweildauern von Wochen, um sich auch in Replikate einzunisten. Ein heutiger DRP muss daher unveränderliche Backups (immutable / WORM), Air-Gap- oder Offline-Kopien, getrennte Authentifizierung für Backup-Systeme und regelmäßige Integritätsprüfungen zwingend vorsehen. Die Wiederherstellungszeit wird in der Praxis oft nicht durch Technik begrenzt, sondern durch die Zeit, die forensische Analyse und Incident Response benötigen, um saubere Wiederherstellungspunkte zu bestimmen.

Anforderungen aus Standards und Versicherern

Der BSI IT-Grundschutz-Baustein CON.3 „Datensicherungskonzept" und der Baustein DER.4 „Notfallmanagement" definieren konkrete Anforderungen an Backup- und Recovery-Verfahren. ISO 27001 fordert in den Controls A.5.30 („ICT readiness for business continuity") und A.8.13 („Information backup") dokumentierte Wiederherstellungsverfahren, RTO-gerechte Tests sowie regelmäßige, geprüfte Backups; A.5.29 ergänzt dies um den Erhalt der Informationssicherheit während einer Störung. Cyber-Versicherer prüfen die Existenz, Aktualität und Testpraxis des DRP — fehlende oder nicht getestete Pläne führen regelmäßig zu Prämienzuschlägen, Deckungseinschränkungen oder Ablehnungen im Schadensfall.

Relevanz für KMUs

Für mittelständische Unternehmen ist der DRP der konkreteste und am leichtesten messbare Teil des Notfallmanagements — er lässt sich testen, dokumentieren und schrittweise verbessern. Der pragmatische Einstieg: ein priorisiertes Asset-Register mit den fünf wichtigsten Systemen, dokumentierte Restore-Verfahren pro System und mindestens halbjährliche Recovery-Tests in realistischen Szenarien — inklusive eines vollständigen Restores aus dem Backup auf separate Hardware. Wer dabei feststellt, dass die tatsächliche Wiederherstellungszeit das definierte RTO um ein Vielfaches überschreitet, hat eine wertvolle Erkenntnis gewonnen, bevor der Ernstfall sie erzwingt.