Disaster Recovery as a Service (DRaaS)
Disaster Recovery as a Service (DRaaS) ist ein Managed-IT-Service, bei dem ein externer Anbieter die Wiederherstellung von IT-Systemen, Anwendungen und Daten nach Ausfällen übernimmt. Als Teil des Business Continuity Managements sichert DRaaS Geschäftsprozesse, minimiert Ausfallzeiten durch schnelle Recovery-Mechanismen und schützt zunehmend auch vor komplexen Cyberangriffen wie Ransomware.
Was ist Disaster Recovery as a Service?
Bei Disaster Recovery as a Service (DRaaS) handelt es sich um einen Managed-IT-Service. DRaaS ist ein Spezialfall von Disaster Recovery (dt. Katastrophenwiederherstellung), also der geplanten Wiederherstellung von IT-Systemen, Anwendungen und Daten nach einem schwerwiegenden Ausfall. Wie der Zusatz „as a Service“ ausdrückt, wird die Aufgabe an eine dritte Partei als Dienstleistung übertragen.
Disaster Recovery ist ein integraler Bestandteil des Business Continuity Managements (BCM), zu Deutsch Betriebskontinuitätsmanagement. Ziel ist es, kritische Geschäftsprozesse auch bei Störungen oder Ausfällen weiterführen oder schnell wiederherstellen zu können. Die konkreten Maßnahmen, Verantwortlichkeiten und Abläufe werden dabei in einem Business Continuity Plan (BCP) festgehalten. Das ist heute wichtiger denn je, da Unternehmen nicht nur mit klassischen IT-Ausfällen, sondern zunehmend auch mit komplexen Cyberangriffen konfrontiert sind, etwa durch Ransomware, kompromittierte Zugänge oder kombinierte Angriffe auf Systeme und Daten.
In der Praxis lassen sich drei eng miteinander verbundene Teilaspekte der Betriebskontinuität unterscheiden:
- High Availability (HA): Systeme sind so ausgelegt, dass Ausfälle einzelner Komponenten möglichst ohne Unterbrechung abgefangen werden.
- Continuous Operations (CO): Der Betrieb wird auch während Störungen oder geplanter Wartungsarbeiten möglichst aufrechterhalten.
- Disaster Recovery (DR): Nach einem gravierenden Ausfall werden Systeme, Daten und Dienste planmäßig wiederhergestellt.
Gerade bei geschäftskritischen Anwendungen reicht es heute jedoch oft nicht mehr aus, Systeme irgendwann wiederherzustellen. Zunehmend wichtig wird deshalb der Aspekt der Instant Recovery. Gemeint ist damit eine besonders schnelle Form der Disaster Recovery, bei der Systeme, Anwendungen und Daten im Ernstfall möglichst sofort oder innerhalb sehr kurzer Zeit wieder verfügbar sein sollen, um Ausfallzeiten und Betriebsunterbrechungen so gering wie möglich zu halten.
- Kostengünstige vCPUs und leistungsstarke dedizierte Cores
- Höchste Flexibilität ohne Mindestvertragslaufzeit
- Inklusive 24/7 Experten-Support
Abgrenzung von Backups und klassischer DR
Da DRaaS nicht nur einzelne Daten sichert, sondern die Wiederherstellung betriebsrelevanter Systeme, Anwendungen und Abläufe nach einem Ausfall ermöglicht, lässt sich der Dienst klar von klassischen Backup-Lösungen abgrenzen. Ein herkömmliches Backup erstellt in erster Linie Datenkopien, die im Bedarfsfall zurückgespielt werden können. BaaS übernimmt diese Datensicherung als Dienstleistung durch einen externen Anbieter. Von der klassischen Disaster Recovery unterscheidet sich DRaaS vor allem dadurch, dass Planung, technische Plattform, Automatisierung und je nach Modell auch Betrieb, Überwachung und Unterstützung im Notfall ganz oder teilweise von einem externen Dienstleister übernommen werden.
Die folgende Auflistung gewährt einen kurzen Überblick über die vier Konzepte:
- Backup: Kopie von Daten zur späteren Wiederherstellung
- BaaS: Backup als Dienstleistung durch einen externen Anbieter
- DR: Wiederherstellung von IT-Systemen, Anwendungen und Prozessen nach einem Ausfall
- DRaaS: Disaster Recovery als Dienstleistung durch einen externen Anbieter
Was sind die wichtigsten DRaaS-Konzepte?
Die Grundlage jeder Disaster-Recovery-Strategie ist eine frühzeitige und realistische Planung. Wer sich erst im Schadensfall mit Zuständigkeiten, Wiederanlaufreihenfolgen oder Sicherungskonzepten beschäftigt, reagiert in der Regel zu spät. Deshalb umfasst eine gute DRaaS-Strategie nicht nur Backups, sondern auch klar definierte Prioritäten, Abhängigkeiten zwischen Systemen und konkrete Wiederherstellungsschritte.
Eine wichtige Basis für die Datensicherung ist dabei seit Langem die 3-2-1-Regel. Sie besagt, dass für alle wichtigen Daten drei Versionen vorgehalten werden: das Original sowie zwei zusätzliche Kopien. Dabei kommen mindestens zwei verschiedene Medientypen zum Einsatz. Eine der Kopien muss außerdem an einem physisch getrennten Ort gespeichert werden. In modernen IT-Umgebungen wird diese Grundregel jedoch erweitert. Heute gehören zusätzlich unveränderliche oder logisch isolierte Sicherungen sowie regelmäßig getestete Wiederherstellungen zum Stand der Praxis.
Um DRaaS-Konzepte zu bewerten und zu planen, sind vor allem zwei Kennzahlen entscheidend:
- Recovery Time Objective (RTO): Zeitraum vom Eintritt des Schadens bis zur Wiederherstellung eines akzeptablen Betriebszustands. Beispiel: Ein Online-Shop definiert, dass das Bestellsystem spätestens nach zwei Stunden wieder verfügbar sein muss.
- Recovery Point Objective (RPO): Maximal tolerierbarer Datenverlust. Beispiel: Bei einem RPO von 15 Minuten dürfen im Ernstfall höchstens die Daten verloren gehen, die in den letzten 15 Minuten vor dem Ausfall noch nicht gesichert oder repliziert wurden.
Je nach Kritikalität der Systeme kommen dabei unterschiedliche Replikationsmethoden zum Einsatz:
- Real-time Replication: Kritische Workloads werden kontinuierlich oder nahezu in Echtzeit in eine Ersatzumgebung repliziert. Das eignet sich für Systeme mit sehr niedrigen RTO- und RPO-Vorgaben.
- Snapshot-basierte Replikation: Für weniger zeitkritische Daten werden Wiederherstellungspunkte in festen Intervallen erstellt. Diese Methode ist meist weniger aufwendig, erlaubt aber größere Abstände zwischen den Wiederherstellungspunkten.
Damit die Datensicherung in der Praxis eingehalten werden kann, kommen weitere zentrale DRaaS-Mechanismen hinzu:
- Failover und Failback: Im Notfall wird auf eine Ersatzumgebung umgeschaltet und nach der Stabilisierung wieder kontrolliert zurückgewechselt.
- Recovery-Orchestrierung: Es wird festgelegt, in welcher Reihenfolge Systeme und Dienste wieder hochgefahren werden.
- Immutable oder isolierte Backups: Sie schützen Wiederherstellungspunkte vor Manipulation, etwa bei Ransomware-Angriffen.
Um vor allem die RTO zu verkürzen und in Kombination mit passender Replikation auch niedrige RPO-Werte zu erreichen, setzen viele DRaaS-Konzepte auf sogenannte Failover-Sites. Dabei handelt es sich um vorbereitete Ersatzumgebungen oder Spiegelungen kritischer Systeme, die im Ausfall kurzfristig aktiviert werden können. So lässt sich der Geschäftsbetrieb fortführen, bis die eigentliche Produktivumgebung wieder vollständig verfügbar ist.
Neben der technischen Umsetzung bleibt jedoch auch der organisatorische Faktor entscheidend. Kritische Systeme müssen richtig priorisiert, Abhängigkeiten korrekt erfasst und Wiederherstellungsprozesse regelmäßig getestet werden. Denn selbst eine leistungsfähige technische Lösung hilft wenig, wenn Zuständigkeiten unklar sind oder der Wiederanlauf in der Praxis nicht funktioniert.
Welche DRaaS-Modelle gibt es?
Viele Anbieter führen heutzutage Disaster Recovery as a Service im Portfolio. Unabhängig davon, von welchem Anbieter man DRaaS bezieht, lassen sich die Angebote in drei Modelle unterteilen:
| DRaaS-Modell | Erklärung | Vorteile | Nachteile |
|---|---|---|---|
| Self-Service DRaaS | Anbieter stellt die DRaaS-Plattform, Replikations- und Recovery-Funktionen bereit; Planung, Tests und Betrieb liegen weitgehend beim Kunden | hohe Kontrolle, meist geringere laufende Kosten | hoher interner Aufwand; Know-how, Tests und saubere Dokumentation auf Kundenseite erforderlich |
| Assisted DRaaS | Anbieter unterstützt bei Planung, Implementierung, Tests und Optimierung; operative Verantwortung wird zwischen Kunde und Anbieter aufgeteilt | gute Balance aus Kontrolle und externer Expertise | Verantwortlichkeiten müssen klar geregelt werden; mehr Abstimmungsbedarf |
| Managed DRaaS | Anbieter übernimmt große Teile von Betrieb, Überwachung, Recovery-Orchestrierung und Unterstützung im Störfall | geringerer interner Aufwand, standardisierte Prozesse, oft schneller betriebsbereit | höhere Kosten; stärkere Abhängigkeit vom Anbieter; enge Abstimmung zu Prioritäten, Compliance und Wiederherstellungszielen nötig |
Viele Anbieter stellen dafür eine webbasierte Verwaltungsoberfläche bereit. Darüber können Unternehmen oder Dienstleister sehen, welche Systeme geschützt sind, wann zuletzt gesichert wurde und wie eine Wiederherstellung im Ernstfall abläuft. Oft lassen sich auch Tests durchführen, damit im Notfall nicht erst ausprobiert werden muss, ob alles funktioniert.
Implementierungs-Checkliste für Admins
Damit Disaster Recovery im Ernstfall nicht nur auf dem Papier funktioniert, braucht es einen klar strukturierten Ablauf und eine saubere technische Umsetzung. Von der Priorisierung kritischer Systeme über die Auswahl des passenden Service-Modells bis hin zu Testläufen greifen dabei strategische, organisatorische und technische Schritte ineinander.
- Infrastruktur erfassen: Virtuelle Maschinen, Datenbanken, physische Server, Anwendungen, Netzwerke, Speicherorte und technische Abhängigkeiten dokumentieren.
- Business Impact Analysis (BIA) durchführen: Geschäftskritische Anwendungen, Daten und Prozesse identifizieren und nach Priorität ordnen.
- RTO und RPO festlegen: Definieren, wie schnell Systeme wieder verfügbar sein müssen und wie viel Datenverlust maximal akzeptabel ist.
- Risiken bewerten: Mögliche Ausfallszenarien wie Naturkatastrophen, Ransomware, technische Störungen, menschliche Fehler oder Provider-Ausfälle berücksichtigen.
- Bandbreite und Datenvolumen prüfen: Sicherstellen, dass Replikation, Backups, initiales Seeding und Wiederherstellung technisch realistisch umsetzbar sind.
- Passendes Service-Modell auswählen: Entscheiden, ob Self-Service, Assisted oder Managed DRaaS zur internen Kompetenz, Verfügbarkeit und Risikostrategie passt.
- Technische Schutzmaßnahmen einplanen: Replikationsmethode, Verschlüsselung, Zugriffskontrollen, immutable Backups und getrennte Recovery-Bereiche festlegen.
- Initiales Seeding planen: Große Datenmengen für die Erstübertragung berücksichtigen, damit die laufende Replikation später effizient funktioniert.
- DR-Plan erstellen: Wiederherstellungsreihenfolge, Verantwortlichkeiten, Eskalationswege und interne sowie externe Kommunikation dokumentieren.
- Failover und Failback testen: Prüfen, ob Systeme kontrolliert in die Ersatzumgebung wechseln und anschließend sauber in den Normalbetrieb zurückgeführt werden können.
- Sandboxed Testing nutzen: Wiederherstellungen regelmäßig in isolierten Testumgebungen validieren, ohne Produktivsysteme zu gefährden.
- Dokumentation laufend pflegen: Änderungen an Systemen, Anwendungen, Verantwortlichkeiten und Recovery-Zielen regelmäßig nachziehen.
Ransomware-Schutz und Cyber Recovery
Seit Jahren gehören Cyberangriffe zu den wichtigsten Treibern für Investitionen in Disaster Recovery. Dabei verschlüsseln Angreifende die Daten nicht mehr nur, sondern kopieren sie häufig vorher oder drohen mit Veröffentlichung. Das bedeutet: Selbst gute Backups lösen nicht automatisch alle Folgen eines Angriffs, helfen aber entscheidend dabei, Systeme und Daten wieder verfügbar zu machen.
Deshalb hat sich der Blick von klassischer Disaster Recovery hin zu Cyber Recovery erweitert. Wichtige Merkmale moderner Lösungen sind heute unter anderem unveränderliche Backups, logisch oder physisch getrennte Recovery-Bereiche, eingeschränkte Löschmöglichkeiten, versionierte Wiederherstellungspunkte und regelmäßige Restore-Tests. Einige Plattformen ergänzen dies durch zusätzliche Freigabemechanismen und isolierte Umgebungen, in denen Wiederherstellungen geprüft werden können, bevor Systeme wieder produktiv geschaltet werden.
KI-gestütztes Disaster Recovery
Ein neuerer Trend im Bereich DRaaS ist der Einsatz von KI-gestützten Analyse- und Automatisierungsfunktionen. Solche Systeme können Infrastruktur-, Backup- und Monitoring-Daten auswerten, um ungewöhnliche Muster frühzeitig zu erkennen. Dazu zählen beispielsweise auffällige Lastspitzen, ungewöhnliche Zugriffe, fehlerhafte Replikationen oder Anzeichen für beginnende Systemausfälle.
KI ersetzt dabei keinen Disaster-Recovery-Plan, kann aber helfen, Risiken schneller zu erkennen, Warnmeldungen zu priorisieren und Wiederherstellungsprozesse gezielter anzustoßen. In Verbindung mit automatisierten Tests, klar definierten RTO- und RPO-Vorgaben sowie menschlicher Kontrolle kann KI-gestütztes Disaster Recovery dazu beitragen, Ausfälle früher zu bemerken und Recovery-Abläufe effizienter zu steuern.
Was sind die Vor- und Nachteile von DRaaS gegenüber klassischer Disaster Recovery?
DRaaS bietet gegenüber klassischer Disaster Recovery einige wichtige Vorteile, ersetzt diese aber nicht in jedem Fall vollständig. Bei traditioneller Disaster Recovery betreiben Unternehmen häufig eigene Ersatzumgebungen, Zweitstandorte oder zusätzliche Rechenzentrumskapazitäten. Planung, Infrastruktur, Tests, Failover und Wiederherstellung liegen dabei weitgehend in der Verantwortung der internen IT. DRaaS verlagert Teile dieser Aufgaben auf einen externen Anbieter, der Plattform, Replikation, Recovery-Orchestrierung und je nach Modell auch Betrieb und Unterstützung im Notfall bereitstellt.
Die folgende Tabelle zeigt die wichtigsten Unterschiede im Überblick:
| Aspekt | DRaaS | Klassische Disaster Recovery |
|---|---|---|
| Infrastruktur | Nutzt meist Cloud- oder Provider-Infrastrukturen als Recovery-Umgebung | Erfordert häufig eigene Zweitstandorte, Ersatzsysteme oder zusätzliche Rechenzentrumskapazitäten |
| Investitionsaufwand | Geringerer initialer Aufwand, da weniger eigene Hardware aufgebaut werden muss | Höherer Anfangsaufwand durch Hardware, Standorte, Lizenzen und interne Ressourcen |
| Betrieb und Wartung | Je nach Modell teilweise oder vollständig durch den Anbieter unterstützt | Liegt überwiegend bei der internen IT-Abteilung |
| Skalierbarkeit | Ressourcen lassen sich meist flexibler anpassen | Skalierung ist stärker von vorhandener Hardware und Standortkapazität abhängig |
| Wiederherstellung | Häufig stärker automatisiert, orchestriert und über zentrale Plattformen steuerbar | Oft individueller, aber auch manueller und stärker von internen Prozessen abhängig |
| RTO und RPO | Kann kurze Wiederherstellungszeiten und geringe Datenverluste unterstützen, wenn Replikation, Failover und Tests passend eingerichtet sind | Ebenfalls möglich, aber meist mit höherem technischem und organisatorischem Aufwand |
| Tests | Viele Lösungen ermöglichen isolierte oder automatisierte Recovery-Tests | Tests müssen meist stärker selbst geplant, umgesetzt und dokumentiert werden |
| Kontrolle | Weniger direkte Kontrolle über bestimmte Infrastruktur- und Plattformdetails | Hohe Kontrolle über Systeme, Standorte, Sicherheitsarchitektur und Betriebsprozesse |
| Abhängigkeit | Höhere Abhängigkeit vom Anbieter, dessen Plattform, SLAs und Supportprozessen | Stärkere Abhängigkeit von der eigenen Infrastruktur und dem internen Know-how |
| Kostenmodell | Laufende Servicekosten, abhängig von Umfang, Speicher, Workloads und Service-Level | Häufig höhere Investitionskosten sowie laufende Kosten für Standort, Hardware, Betrieb und Personal |
| Eignung | Sinnvoll für Unternehmen, die schnelle Wiederherstellung, externe Expertise und flexible Cloud-Ressourcen nutzen möchten | Sinnvoll für Unternehmen mit sehr spezifischen Compliance-Anforderungen, eigener Infrastrukturstrategie oder hoher interner DR-Kompetenz |
Wie findet man den passenden DRaaS-Anbieter?
Disaster Recovery as a Service ist bei vielen Cloud-Service-Anbietern zu haben. Darüber hinaus existieren angestammte Anbieter, die sich auf Disaster Recovery und Backup-Lösungen spezialisiert haben. Auch Managed Service Provider und Systemhäuser übernehmen je nach Modell die Implementierung, den Betrieb oder die Betreuung entsprechender Lösungen.
Um den passenden DRaaS-Anbieter zu finden, geht man nach dem folgenden Schema vor:
- Zunächst erfolgt eine Bestandsaufnahme: Man erfasst den Ist-Zustand und ermittelt den Umfang der zu sichernden Daten und Systeme.
- Als nächster Schritt gilt es, die eigenen Anforderungen und Ziele zu definieren: Insbesondere zählen dazu Recovery Time Objective (RTO) und Recovery Point Objective (RPO) für die involvierten Daten, Anwendungen und Dienste.
- Weiß man, wie die eigene Infrastruktur aufgestellt ist und kennt man die eigenen Anforderungen und Ziele, geht man dazu über, potenzielle Anbieter auszuwählen. Neben den technischen Möglichkeiten zählen hier vor allem Sicherheitsfunktionen, Compliance-Vorgaben, Anforderungen an Datenresidenz sowie eine faire und nachvollziehbare Preisstruktur.
- Aus den ermittelten Kandidaten muss nun der passende Anbieter gewählt werden. Spätestens an diesem Punkt sollte man Tests durchführen, um die technischen Möglichkeiten der Anbieter umfassend zu überprüfen.
Schauen wir uns die wichtigsten Eckpunkte an, denen ein professioneller DRaaS-Anbieter genügen sollte.
Abdeckung und Replikation
Grundlegend für eine DRaaS-Lösung ist die automatisierte Sicherung und Replikation kritischer Daten, Systeme und Workloads. Die Sicherung sollte über Betriebssystemgrenzen hinweg funktionieren und sämtliche wichtigen Datentypen umfassen. Dazu gehören Dateien, Datenbanken, Serverumgebungen und, falls relevant, auch Endpunkte sowie virtualisierte Umgebungen in virtuellen Maschinen und Containern. Bei der Continuous Data Protection (CDP) wird jede Datenänderung kontinuierlich erfasst, sodass eine Wiederherstellung mit sekundengenauer Granularität möglich ist.
Datenschutz, Integrität und Compliance
Vor dem Transfer zum DRaaS-Anbieter müssen die bei der Speicherung erfassten Daten automatisch verschlüsselt werden. Die Backup-Daten und -Systeme sollten ständig automatisiert auf Fehler und Abweichungen hin überprüft werden. Die Speicherung der Daten sollte geografisch getrennt, redundant und Compliance-konform sein. Unternehmen sollten außerdem klären, in welchen Ländern oder Regionen die Daten verarbeitet und gespeichert werden.
Wiederherstellung, Failover und Multi-Cloud
Im Schadensfall sollte der DRaaS-Anbieter zumindest zwei Leistungen erfüllen: Zum einen gilt es, die betroffenen Systeme wiederherzustellen. Die Wiederherstellung muss sämtliche essenziellen Daten, Anwendungen und Systeme umfassen. Bei der Anbieterwahl sollte bedacht werden, dass ggf. eine Wiederherstellung in Multi-Cloud-Umgebungen nötig ist. Dabei sollten Unternehmen prüfen, ob kritische Recovery-Instanzen, Datenkopien oder Failover-Umgebungen auch über mehrere Cloud-Provider hinweg abgebildet werden können. Eine solche Multi-Cloud-DR-Strategie kann die Abhängigkeit von einem einzelnen Anbieter reduzieren und helfen, Provider-Ausfälle besser abzufangen. Allerdings kann sie auch die Komplexität in puncto Netzwerk, Identitäten, Datenkonsistenz, Monitoring, Kosten und Tests erhöhen.
Zum anderen sollte der DRaaS-Anbieter während der Wiederherstellung Failover-Systeme zwischenschalten, sodass der Betriebsablauf aus Nutzersicht mit minimalen Unterbrechungen weiterläuft.
Ransomware-Resilienz
Mit Blick auf die aktuelle Bedrohungslage sollte ein DRaaS-Anbieter nicht nur klassische Wiederherstellung, sondern auch Ransomware-Schutz berücksichtigen. Dazu gehören unveränderliche oder isolierte Sicherungskopien, Malware-Prüfungen vor der Wiederherstellung, Zugriffskontrollen, Protokollierung und regelmäßige Recovery-Tests. Entscheidend ist, dass im Ernstfall nicht versehentlich kompromittierte oder verschlüsselte Daten in die Produktivumgebung zurückgespielt werden.
Skalierbarkeit und Initial Seeding
Bei sehr großen Datenmengen sollten Unternehmen vorab klären, wie die Erstübertragung und die spätere Wiederherstellung praktisch umgesetzt werden. Eine vollständige Übertragung über das Internet kann ohne initiales Seeding, physische Transfermedien oder dedizierte Leitungen zu lange dauern. Ein geeigneter DRaaS-Anbieter sollte deshalb ein realistisches Konzept für Initial Seeding, laufende Replikation und die Wiederherstellung großer Datenbestände vorlegen.


