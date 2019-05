Disaster Recovery über die Cloud – Ausfallzeiten, Kosten und Fehlerquellen reduzieren

Die Gewährleistung einer schnellen und zuverlässigen Disaster Recover kann kompliziert und teuer sein: Jeder Handgriff, den ein IT-Mitarbeiter tätigen muss, zieht die Prozesse in die Länge. Zudem bergen manuelle Wiederherstellungen Fehlerquellen und gehen zulasten der Effizienz. Tritt der Ernstfall am Wochenende ein, können lange Ausfallzeiten entstehen. Für das betroffene Unternehmen zieht das hohe Umsatzeinbussen und im Zweifel noch schlimmere Folgen nach sich.

In vielen Unternehmen sind längst automatische Prozesse Standard, die es im Ernstfall ermöglichen, Daten und Applikationen auf die Standby-Infrastruktur in der Cloud umzuschalten. So lassen sich Wiederherstellungen während des laufenden Betriebs umsetzten und Ausfallzeiten vermeiden. Dabei gilt es im Wesentlichen, folgende fünf Schritte zu beachten.

1. Priorisieren

Jede Anwendung, die in einem Unternehmen genutzt wird, hat einen speziellen Geschäftswert. Je wichtiger die Applikationen sind, desto kürzer darf die Frist sein, bis sie wiederhergestellt werden. Bei hochkritischen Diensten sind das maximal 15 Minuten. Danach müssten alle Elemente der Anwendung wieder reibungslos funktionieren. Neben dieser sogenannten Recovery Time Objectives (RTOs) ist auch geregelt, wie viele Daten eine Anwendung während des Ausfalls höchstens verlieren darf. Das spiegeln die Recovery Point Objectives (RPOs) wider. Jede Strategie für Disaster Recovery sollte auf diese Werte aufbauen. Data Mover und Replikationstechnologien helfen Unternehmen dabei, kurze RTO-Zeitrahmen einzuhalten.

2. Automatisieren

Automatismen unterstützen nicht nur dabei, Daten und Anwendungen möglichst schnell wiederherzustellen. Sie reduzieren auch die Fehlerquelle. Mitarbeiter sollten mit nur einem Mausklick den gesamten Prozess auslösen können. So lässt sich die Verantwortung auf verschiedene Schultern verteilen. Das ist gerade dann entscheidend, wenn bestimmte Mitarbeiter nicht erreichbar sind, oder äussere Einflüsse wie ein Feuer oder Überschwemmungen schnelle Reaktionen erfordern. Automatisierte Lösungen kennen die Anwendungen und ihre Abhängigkeiten bereits im Vorfeld und können Komplexitäten und Mehrschichtigkeiten berücksichtigen. Um lange und teure Ausfallzeiten zu vermeiden, sollte daher die gesamte Wiederherstellung mit Failover, Failback und Tests vollständig automatisiert sein.

3. Testen

Um auf Nummer sicher zu gehen, dass implementierte Prozesse auch wirklich funktionieren und in der erforderten Zeit ablaufen, sollten Unternehmen sie regelmässig testen. In einigen Branchen sind solche Tests in Compliance-Vorgaben vorgegeben, beispielsweise in der Finanz- und Gesundheitsindustrie. Jedes Unternehmen sollte seinen Recovery-Plan in regelmässigen Abständen auf die Probe stellen.

4. Für Flexibilität sorgen

Recovery ist nicht gleich Recovery. Es macht einen grossen Unterschied, ob nur wenige virtuelle Maschinen, eine grosse Zahl komplexer, mehrschichtiger Anwendungen oder gleich ein ganzes Rechenzentrum umgeschaltet werden soll. Die Recovery-Strategie sollte das flexibel und simpel abbilden.

5. Multi-Cloud-Strategien schaffen

Viele Schweizer Unternehmen setzen auf unterschiedliche Cloud-Umgebungen, um mehrere Geschäftsanwendungen zu hosten. Es ist jedoch ineffizient, für jede dieser Umgebungen ein anderes isoliertes Werkzeug einzusetzen. Denn fragmentierte Tools erhöhen das Risiko für höhere Betriebskosten und längeren Ausfällen. Eine umfassende Disaster-Recovery-Strategie greift dagegen über alle Cloud-Grenzen hinweg und erhöht die Betriebseffizienz erheblich.

Es ist schwierig, die Dauer des Disaster-Recovery-Prozesses bei den vielen unterschiedlichen Applikationen und Diensten vorhersehbar zu kontrollieren. Anwendungen laufen heute oft über verschiedene Plattformen und Betriebssysteme hinweg und greifen auf zahlreiche fragmentierte Storage-Systeme zurück, um Informationen zu speichern. Je komplexer die Umgebung, desto höher die Gefahr bei manuellen Prozessen. Wer sich jedoch an den fünf Schritten orientiert und eine umfassende Disaster-Recovery-Strategie implementiert, wird den Prozess berechenbar machen und verlässlich über die Multi Cloud abwickeln können.

Autor: Mathias Wenig, Senior Technical Sales und Digital Transformation Specialist DACH bei Veritas Technologies