Cloud Disaster Recovery: Bestens vorbereitet für den Worst Case

Inhaltsverzeichnis

Cloud Disaster Recovery (Cloud DR) sichert Daten, Anwendungen und ganze IT-Systeme in einer Cloud-Umgebung ab, damit sie nach Ausfällen schnell wiederhergestellt werden können. Entscheidend sind dabei klare Wiederherstellungsziele, regelmäßige Tests, passende Architekturmodelle sowie Schutzmechanismen gegen Cyberangriffe und Compliance-Verstöße.

IONOS CLOUD Object Storage

Daten sicher und günstig speichern

Ersetzen Sie eigene, kostenintensive Speicherlösungen mit IONOS CLOUD Object Storage. Es ist hochgradig skalierbar, äußerst kosteneffizient und integriert sich in Ihre Anwendungsszenarien. Die extrem hohe Ausfallsicherheit unserer Server sowie eine individuelle Zugriffssteuerung schützen Ihre Daten zuverlässig.

Was ist Cloud Disaster Recovery (Cloud DR)?

Cloud Disaster Recovery (dt. cloudbasierte Notfallwiederherstellung), oder kurz Cloud DR, bezeichnet eine Notfall-Absicherungsstrategie für Daten, Workloads, Anwendungen, Konfigurationen und IT-Infrastruktur. Anders als herkömmliche Ansätze setzt Cloud DR auf eine Speicherung in der Cloud. Kommt es zu einem Ausfall, lassen sich die betroffenen Daten, Anwendungen und sonstigen Ressourcen aus der Cloud wiederherstellen, um den gewohnten Geschäftsalltag schnellstmöglich wieder aufnehmen zu können. Mittlerweile bieten verschiedene Unternehmen Disaster Recovery as a Service (DRaaS) an.

Hinweis

Was unterscheidet Cloud Disaster Recovery von einfachen Cloud-Backups?

Cloud-Backups und Cloud Disaster Recovery verfolgen unterschiedliche Ziele: Ein Cloud-Backup sichert in erster Linie Daten, damit sie bei Verlust wiederhergestellt werden können. Cloud DR geht weiter und berücksichtigt auch Anwendungen, Systeme, Konfigurationen und Wiederherstellungsprozesse. Ziel ist nicht nur die Rücksicherung einzelner Dateien, sondern der schnelle Wiederanlauf geschäftskritischer IT-Services nach einem Ausfall.

Daran anknüpfend spielen klar definierte Wiederherstellungsziele eine zentrale Rolle in modernen Cloud-DR-Strategien: Das Recovery Point Objective (RPO) beschreibt den maximal tolerierbaren Datenverlust, während das Recovery Time Objective (RTO) die maximale Dauer eines Systemausfalls festlegt. Diese Kennzahlen helfen dabei, Anforderungen an Verfügbarkeit und Datensicherheit konkret zu definieren und passende technische und organisatorische Maßnahmen für den Ernstfall abzuleiten.

Hinweis

Trotz der Auslagerung vieler technischer Komponenten gilt bei Cloud DR das Prinzip der geteilten Verantwortung: Während der Provider die Cloud-Infrastruktur und deren Betrieb absichert, bleibt das Unternehmen für die eigene DR-Strategie verantwortlich – etwa für die Priorisierung kritischer Systeme, die Definition von Wiederherstellungszielen, die Vergabe von Zugriffsrechten sowie regelmäßige Tests der Wiederherstellungsprozesse.

Der Cloud-DR-Lebenszyklus in der Praxis

Damit Cloud Disaster Recovery im Ernstfall zuverlässig funktioniert, reicht es nicht aus, lediglich Sicherungen in der Cloud abzulegen. Vielmehr handelt es sich um einen fortlaufenden Prozess, der regelmäßig überprüft, angepasst und getestet werden muss. Der DR-Lebenszyklus umfasst dabei mehrere aufeinander aufbauende Phasen:

Risikoanalyse und Business-Impact-Analyse

Am Anfang steht die Identifikation der kritischen Workloads, Anwendungen, Systeme und Datenbestände, die für den Geschäftsbetrieb unverzichtbar sind. Ergänzend dazu wird im Rahmen einer Business-Impact-Analyse (BIA) bewertet, welche geschäftlichen Folgen der Ausfall einzelner Prozesse und IT-Ressourcen hätte. So lässt sich bestimmen, welche Systeme besonders priorisiert abgesichert werden müssen und welche Anforderungen an Wiederherstellungszeit und maximal tolerierbaren Datenverlust gelten.

Zusätzlich wird analysiert, welche Abhängigkeiten zwischen den einzelnen IT-Ressourcen bestehen und welche Ausfallrisiken besonders schwer wiegen. Diese Bewertung bildet die Grundlage für die gesamte Disaster-Recovery-Strategie.

Implementierung

Aufbauend auf der Analyse wird die technische Umsetzung der Recovery-Umgebung geplant und eingerichtet. In modernen Cloud-DR-Konzepten erfolgt dies häufig automatisiert über Infrastructure-as-Code- und Konfigurationsmanagement-Tools wie Terraform oder Ansible.

Der Vorteil: Infrastrukturen, Konfigurationen und Wiederherstellungsprozesse lassen sich standardisiert, reproduzierbar und deutlich schneller bereitstellen. Gleichzeitig sinkt das Risiko manueller Fehler, und Anpassungen können bei veränderten Anforderungen effizient umgesetzt werden.

Testing

Damit die Wiederherstellung im Ernstfall nicht nur auf dem Papier funktioniert, sind regelmäßige Tests unverzichtbar. Dazu gehören automatisierte Failover-Tests, mit denen überprüft wird, ob Systeme, Anwendungen und Daten wie geplant in die Cloud-Umgebung umgeschaltet werden können. Ebenso wichtig ist das Failback – also der geregelte Rückwechsel in die ursprüngliche oder eine neu aufgebaute Primärumgebung, nachdem der Notfallbetrieb stabilisiert wurde.

Nur wenn sowohl Failover als auch Failback getestet werden, lässt sich sicherstellen, dass der gesamte Wiederherstellungsprozess in der Praxis funktioniert und keine Inkonsistenzen oder ungeplanten Ausfallzeiten beim Rückwechsel entstehen. Besonders wichtig ist, dass solche Tests möglichst ohne Betriebsstörung stattfinden, damit Unternehmen ihre Notfallstrategie realistisch prüfen können, ohne den laufenden Geschäftsbetrieb zu gefährden.

Optimierung und Aktualisierung

Da sich IT-Landschaften, Geschäftsprozesse und Bedrohungsszenarien laufend verändern, muss auch die Cloud-DR-Strategie kontinuierlich weiterentwickelt werden. Neue Anwendungen, geänderte Prioritäten oder zusätzliche Sicherheitsanforderungen sollten regelmäßig in die Planung einfließen. Nur so bleibt gewährleistet, dass die Disaster-Recovery-Maßnahmen auch langfristig zum tatsächlichen Bedarf des Unternehmens passen.

Cyber Recovery

Das Thema Cyber Recovery gewinnt zunehmend an Bedeutung. Anders als beim klassischen Disaster Recovery geht es dabei nicht nur um eine schnelle Wiederherstellung nach einem Ausfall, sondern um die Rückkehr in einen vertrauenswürdigen Betriebszustand nach einem Cyberangriff, etwa durch Ransomware oder Datenmanipulation.

Zu diesem Zweck kommen häufig unveränderliche Wiederherstellungspunkte (Immutable Backups) sowie Air-Gap-Konzepte zum Einsatz, bei denen Backup-Daten und Recovery-Infrastrukturen physisch oder logisch vom Produktivnetz getrennt werden. So soll verhindert werden, dass Angreifer im Ernstfall auch die Wiederherstellungsbasis kompromittieren.

Vor einem Restore werden die gesicherten Daten und Systemabbilder in der Regel in einer isolierten Recovery- oder Cleanroom-Umgebung überprüft. In einer solchen Secure Isolated Recovery Environment (SIRE) lässt sich kontrollieren, ob Backups unveränderbar, frei von Malware und für die Wiederinbetriebnahme geeignet sind. Erst danach werden Anwendungen, Daten und Systeme schrittweise und kontrolliert in die Produktivumgebung zurückgeführt.

Hinweis

Ergänzend setzen moderne Cyber-Recovery-Lösungen zunehmend auf KI- bzw. ML-gestützte Anomalieerkennung während Backup und Replikation. Dabei werden auffällige Muster wie ungewöhnlich viele Dateiänderungen, plötzlich steigende Datenentropie, verdächtige Verschlüsselungsaktivitäten oder unerwartete Löschvorgänge erkannt. Solche Hinweise können dabei helfen, kompromittierte Wiederherstellungspunkte frühzeitig zu identifizieren und nur saubere Daten für die Wiederherstellung zu verwenden.

Welche Vorteile bietet Cloud DR gegenüber klassischen Konzepten?

Disaster Recovery gibt es prinzipiell auch ohne Cloud – die Absicherung der geschäftskritischen Ressourcen findet bei den klassischen Ansätzen der Notfallwiederherstellung hausintern, über ein zweites Rechenzentrum, Colocation, einen Ausweichstandort oder einen Dienstleister statt. Insbesondere in vier Punkten zeigen sich dabei deutliche Unterschiede im Vergleich zum modernen Cloud-Disaster-Recovery-Konzept:

Komplexität und Wartungsaufwand

Der entscheidende Unterschied zwischen Cloud DR und klassischer DR ist der Aufwand, der mit Einrichtung und Pflege der erforderlichen Hard- und Software für die Absicherung und Wiederherstellung verknüpft ist. Unternehmen, die sich für einen Notfallplan in der Cloud entscheiden, profitieren von dem Vorteil, dass sämtliche Technik ausgelagert wird und nicht in den eigenen Räumen aufgebaut und administriert werden muss.

Außerdem übernimmt der Cloud-Provider die Wartung der zugrunde liegenden Infrastruktur. Je nach Servicemodell oder DRaaS-Angebot können zusätzlich Teile der Orchestrierung, Überwachung und Wiederherstellungsprozesse durch den Anbieter oder einen Managed Service Provider abgedeckt werden.

Kosten und Flexibilität

Cloud Disaster Recovery kann Investitionskosten für eigene Hardware und Ausweichinfrastruktur reduzieren, ersetzt diese aber durch laufende Betriebskosten. Je nach Modell entstehen diese unter anderem für:

Speicher
Replikation
Compute-Ressourcen
Tests
Datenübertragung

Besonders Warm Standby und Multi-Site Active/Active sind dauerhaft kostenintensiv, weil Recovery-Umgebungen bereits teilweise oder vollständig aktiv betrieben werden. Der finanzielle Vorteil hängt daher stark von den angestrebten RTO- und RPO-Zielen ab.

Sicherheit

Ein weiterer Vorteil von Cloud DR ist der hohe Sicherheitsstandard, den Cloud-Service-Provider oder Systemhäuser bieten. Dabei geht es nicht nur um die digitale Sicherheit der Daten, die durch Sicherheits- und Verschlüsselungssoftware erzielt wird. Auch der Schutz vor einem Diebstahl der Daten vor Ort, vor Naturkatastrophen oder Bränden ist in einem externen Rechenzentrum deutlich höher als bei einer Lagerung der Daten im eigenen Unternehmen.

Datenschutz

Je nach Branche, Unternehmensgröße und Art der verarbeiteten Daten müssen beim Einsatz von Cloud Disaster Recovery bestimmte Datenschutz-, Sicherheits- und Compliance-Vorgaben eingehalten werden. Dazu zählen unter anderem Anforderungen an Datenresidenz, Verschlüsselung, Zugriffskontrollen, Aufbewahrung, Auditierbarkeit und – bei internationalen Datenflüssen – die rechtliche Absicherung von Drittlandtransfers.

Für betroffene Unternehmen sind außerdem Vorgaben aus der deutschen NIS2-Umsetzung bzw. dem novellierten BSIG relevant. Dazu zählen unter anderem Maßnahmen zur Aufrechterhaltung des Betriebs, etwa Backup-Management, Wiederherstellung nach einem Notfall und Krisenmanagement.

Die passende Cloud-DR-Architektur finden

Je nach Schutzbedarf, Budget und tolerierbarer Ausfallzeit kommen im Cloud Disaster Recovery unterschiedliche Architekturmodelle infrage. Sie unterscheiden sich vor allem darin, wie viele Systeme in der Cloud bereits vorbereitet oder aktiv betrieben werden und wie schnell sich der Geschäftsbetrieb im Ernstfall wieder aufnehmen lässt.

Cloud-DR-Modell	RTO/RPO	Kosten und Aufwand	Geeignet für
Backup and Restore	eher hoch	niedrig	weniger kritische Systeme, Archivdaten, Anwendungen mit tolerierbarer Ausfallzeit
Pilot Light	mittel	niedrig bis mittel	wichtige Anwendungen, bei denen ein schnellerer Wiederanlauf nötig ist, aber keine permanente Vollumgebung betrieben werden soll
Warm Standby	niedrig	mittel bis hoch	geschäftskritische Anwendungen mit kurzen tolerierbaren Ausfallzeiten
Multi-Site Active/Active	sehr niedrig	sehr hoch	hochkritische Anwendungen, bei denen Downtime kaum oder gar nicht akzeptabel ist

Backup and Restore

Dies ist die einfachste und kostengünstigste Form von Cloud Disaster Recovery. Dabei werden vor allem Daten, Backups, Systemabbilder und zentrale Konfigurationsinformationen in der Cloud gespeichert. Im Notfall wird die benötigte Recovery-Umgebung erst auf Basis dieser Sicherungen wiederhergestellt oder neu aufgebaut.

Pilot Light

Bei diesem Ansatz wird in der Cloud ein betriebsbereiter Minimal-Kern der Recovery-Umgebung dauerhaft vorgehalten. Dazu gehören insbesondere replizierte Datenbestände sowie die für deren Synchronisation und Grundfunktion erforderlichen Kernkomponenten. Andere Teile der Anwendungslandschaft – etwa zusätzliche Compute- und Applikationsressourcen – sind zwar vorbereitet, werden aber erst im Test- oder Notfall vollständig aktiviert bzw. hochgefahren.

Dadurch unterscheidet sich Pilot Light klar von Backup and Restore: Während dort die Zielumgebung im Ernstfall erst weitgehend neu aufgebaut werden muss, existiert bei Pilot Light bereits eine teilweise vorbereitete und laufende Basis. Allerdings kann diese Umgebung nicht ohne zusätzliche Schritte sofort produktiven Traffic übernehmen. Das Modell eignet sich daher vor allem für Unternehmen, die geschäftskritische Daten und Kernsysteme mit überschaubarem Ressourcenaufwand absichern möchten.

Warm Standby

Beim Warm-Standby-Modell werden unternehmenskritische Daten, Anwendungen und zentrale Systemkomponenten fortlaufend in einer vorbereiteten Cloud-Umgebung gespiegelt. Im Unterschied zu Pilot Light ist diese Umgebung jedoch bereits so weit betriebsbereit, dass sie im Ernstfall sofort produktiven Traffic übernehmen kann – wenn auch meist zunächst mit reduzierter Kapazität. Wird die Recovery-Umgebung dagegen bereits in voller oder nahezu voller Produktionskapazität vorgehalten, spricht man häufig von Hot Standby.

Dadurch fallen RTO und RPO in der Regel günstiger aus als bei einfacheren Recovery-Modellen. Dem stehen jedoch höhere laufende Kosten und ein größerer Betriebsaufwand gegenüber, da mehr Ressourcen dauerhaft vorgehalten und synchronisiert werden müssen. Warm Standby ist vor allem dann sinnvoll, wenn Ausfälle nur für kurze Zeit tolerierbar sind und eine schnelle Übernahme des Betriebs entscheidend ist.

Multi-Site Active/Active

Dieses Modell bietet die höchste Stufe der Ausfallsicherheit. Dabei werden Workloads und Daten parallel über mehrere aktive Standorte oder Cloud-Umgebungen hinweg betrieben. Fällt ein Standort aus, wird der Traffic auf die verbleibenden aktiven Umgebungen gelenkt, sodass der Betrieb unmittelbar oder nahezu ohne Unterbrechung weiterlaufen kann. Dadurch lassen sich Downtimes auf ein Minimum reduzieren oder im Idealfall ganz vermeiden.

Demgegenüber stehen jedoch der höchste technische Aufwand, eine komplexe Orchestrierung und deutlich höhere laufende Kosten. Multi-Site-Architekturen eignen sich vor allem für hochkritische Anwendungen, bei denen selbst kurze Unterbrechungen schwerwiegende Folgen hätten.

Die besten Tipps für den Umstieg auf Cloud Disaster Recovery

Ob lokal oder in der Cloud: Ein Disaster-Recovery-Plan, der optimal auf die Belange des Unternehmens zugeschnitten ist, ist nicht von heute auf morgen erstellt. Bei der Planung der Business Continuity (dt. betriebliche Kontinuität) ist die Wahl des geeigneten Partners nämlich nicht die einzige Baustelle. Wir haben einige nützliche Tipps zusammengefasst, die Ihnen die Umstellung auf einen Notfallwiederherstellungsplan in der Cloud vereinfachen.

Tipp 1: Verantwortlichkeiten klären

Auch wenn Sie bei einer Cloud-DR-Lösung den Großteil der Verantwortung und des Managementaufwands an einen Provider abgeben, benötigen Sie innerhalb des Unternehmens Verantwortliche, die sich um die Planung und Aufrechterhaltung der Datenabsicherung kümmern. Geschultes Personal, das sich seiner Aufgaben und Pflichten bewusst ist, ist daher für eine effiziente Cloud-Disaster-Recovery-Strategie unverzichtbar.

Tipp 2: Genau definieren, was ein „Disaster“ ist

Es ist sehr wichtig, dass klar definiert ist, in welchen Fällen eine Cloud DR zum Tragen kommt. Wird eine solche Lösung bereits benötigt, wenn bestimmte Anwendungen ausfallen oder einzelne Daten verloren gehen? Oder sind mit „Disaster“ klassische Katastrophen wie Erdbeben, Überflutungen, Brände und ähnliche Ereignisse gemeint?

Tipp 3: Den passenden Anbieter wählen

Die Anbieterwahl spielt beim Thema Cloud DR eine zentrale Rolle: Unternehmen haben dabei viele Punkte zu beachten, die weit über typische Faktoren wie Kosten oder Vertragslaufzeiten hinausgehen. Zum einen muss der gewählte Anbieter die Ansprüche an Datenschutz und -sicherheit erfüllen – Stichwort: DSGVO. Zum anderen ist entscheidend, welche zusätzlichen Services verfügbar sind. Wenn Sie beispielsweise möglichst wenig Eigenaufwand betreiben möchten, ist ein Managed Service Provider, der das komplette DRaaS-Paket anbietet, die beste Lösung.

Tipp 4: Vendor Lock-In vermeiden

Viele Unternehmen neigen dazu, Hard- und Software-Ressourcen nur bei einem einzigen Anbieter zu mieten, um die gemieteten Services so einfach wie möglich im Blick behalten zu können, und machen sich damit stark abhängig von diesem Provider. Behalten Sie diesen sogenannten „Vendor Lock-In“ bei der Wahl Ihrer Cloud-Disaster-Recovery-Ressourcen (und auch bei der Wahl anderer neuer Cloud-Services) im Kopf.

Tipp 5: Cloud-Disaster-Recovery-Plan testen

Im besten Fall müssen Sie Ihren Cloud-DR-Plan niemals ausrollen, doch ausgehen können Sie von diesem Wunschszenario natürlich nicht. Um jedoch bis zu einem möglichen Vorfall nicht im Ungewissen darüber zu sein, ob der Plan funktioniert, sollten Sie Ihr Cloud-Disaster-Recovery-Konzept in Zusammenarbeit mit Ihrem Provider im Vorfeld testen.

Private Cloud powered by VMware

Cloud? Aber sicher!

Jederzeit vollständige Datenhoheit sowie Datenkontrolle
Im Einklang mit allen gesetzlichen Regelungen in Deutschland
Ohne Vendor Lock-in für höchste Flexibilität

Reviewer

Christian Heldmaier
Christian Heldmaier ist ein erfahrener Online-Marketing- und SEO-Spezialist aus Karlsruhe. Seit Juli 2020 ist er als SEO Manager bei IONOS tätig.

10 Jahre Digital Guide: Eine Erfolgsgeschichte

KI-Telefonassistent: Die Live-Demo

KI-Wissen für Ihren Erfolg

Unser Newsletter bringt Ihnen die wichtigsten Insights rund um KI – verständlich, praxisnah und auf den Punkt.

Was ist ITIL (Information Technology Infrastructure Library)?

Information Technology Infrastructure Library, kurz ITIL, ist der wichtigste Ansatz für ein erfolgreiches und effizientes IT-Service-Management. Der Leitfaden liefert wichtigen Input über den gesamten Service-Lebenszyklus sowie Best Practices, die Unternehmen und…

Digitalisierung
Lexikon

ESB ProfessionalShutterstock

Cloud Computing: Die Vorteile

Cloud Computing hat sich als dominantes Modell für die Nutzung von IT-Infrastruktur etabliert. Statt Hardware selbst zu betreiben, werden die benötigten Ressourcen und Dienste angemietet. Für die meisten Unternehmen bietet dieser Ansatz zahlreiche Vorteile in Bezug auf…

Cloud
Cloud Computing
Lexikon

nmediashutterstock

Cloud-Security

Im digitalen Zeitalter wird immer häufiger auf Cloud-Dienste zurückgegriffen. Dabei ist die Cloud-Nutzung keineswegs frei von Sicherheitsrisiken. Besonders die Multi-Cloud-Umgebungen größerer Unternehmen werden zur Herausforderung für die Datensicherheit – schließlich müssen die…

Cloud
Sicherheit
Verschlüsselung

SFIO CRACHOShutterstock

Wiederherstellungspartition löschen

Die Wiederherstellungspartition kommt zum Einsatz, wenn ein Computer in seinen früheren Zustand zurückversetzt werden soll. Das ist praktisch, wenn es Probleme mit der aktuellen Installation gibt oder wenn Sie das Gerät abgeben wollen. Sie können Sie aber auch die…

Tutorials

Cloud Disaster Recovery: Bestens vor­be­rei­tet für den Worst Case

Was ist Cloud Disaster Recovery (Cloud DR)?

Der Cloud-DR-Le­bens­zy­klus in der Praxis

Ri­si­ko­ana­ly­se und Business-Impact-Analyse

Im­ple­men­tie­rung

Testing

Op­ti­mie­rung und Ak­tua­li­sie­rung

Cyber Recovery

Welche Vorteile bietet Cloud DR gegenüber klas­si­schen Konzepten?

Kom­ple­xi­tät und War­tungs­auf­wand

Kosten und Fle­xi­bi­li­tät

Si­cher­heit

Da­ten­schutz

Die passende Cloud-DR-Ar­chi­tek­tur finden

Backup and Restore

Pilot Light

Warm Standby

Multi-Site Active/Active

Die besten Tipps für den Umstieg auf Cloud Disaster Recovery

Tipp 1: Ver­ant­wort­lich­kei­ten klären

Tipp 2: Genau de­fi­nie­ren, was ein „Disaster“ ist

Tipp 3: Den passenden Anbieter wählen

Tipp 4: Vendor Lock-In vermeiden

Tipp 5: Cloud-Disaster-Recovery-Plan testen

Reviewer

Cloud Disaster Recovery: Bestens vorbereitet für den Worst Case

Der Cloud-DR-Lebenszyklus in der Praxis

Risikoanalyse und Business-Impact-Analyse

Implementierung

Optimierung und Aktualisierung

Welche Vorteile bietet Cloud DR gegenüber klassischen Konzepten?

Komplexität und Wartungsaufwand

Kosten und Flexibilität

Sicherheit

Datenschutz

Die passende Cloud-DR-Architektur finden

Tipp 1: Verantwortlichkeiten klären

Tipp 2: Genau definieren, was ein „Disaster“ ist