Disaster Recovery: Die gefährliche Lücke zwischen Theorie und Praxis schließen

Was man beachten muss, damit es mit der IT-Notfallplanung klappt

Berlin, 26. Februar 2013 – Disaster Recovery (DR, IT-Notfallplanung) hilft Unternehmen im Katastrophenfall dabei, geschäftskritische Daten wiederherzustellen. Ziel ist es, Ausfallzeiten, die u.a. zu Umsatzeinbußen führen, zu verringern oder ganz zu verhindern. Allerdings erweist sich die Realisierung eines schlüssigen IT-Notfallplans als Herausforderung für viele Unternehmen. Geschäftskritische Prozesse sind zwar bekannt, welche IT-Systeme damit verbunden sind, aber selten. Die bei einer Katastrophe entstehenden Kosten sind ungewiss, ebenso wie der Preis und die technischen Randbedingungen der Einführung einer DR-Lösung. Was ist zu beachten, um die Lücke zwischen Theorie und Praxis zu schließen?

Die Einführung einer solchen Lösung startet in der Theorie mit einer Business-Impact-Analyse (BIA), die nach geschäftskritischen Prozessen und Anwendungen im Unternehmen fragt. In der Analyse geht es darum zu definieren, welche maximale Ausfallzeit von IT-Systemen (RTO) und welcher maximale Datenverlust (RPO) nicht geschäftskritisch sind. Auf Basis dieser Werte können garantierte Verfügbarkeiten der IT bestimmt werden. Danach soll die Realisierung folgen. In der Praxis sind das aber nicht zwei Schritte, sondern bei guter Vorarbeit auf beiden Seiten viele Abstimmungsrunden, in denen Kunde und IT-Dienstleister eine technisch und kommerziell ausgewogene Lösung gemeinsam entwickeln. Die anfangs sehr hohen RTO- und RPO-Anforderungen des Anwenders und die Kosten für die technische Umsetzung haben dann eine vertretbare Balance gefunden. Um diesen Prozess zu verkürzen, und somit wertvolle Projektzeit und -kosten einzusparen, empfiehlt Interoute das folgende, allgemein akzeptierte Vorgehen:

Erster Schritt: Die Kosten des Ausfalls der IT-Systeme im DR-Fall genau bestimmen:

Neben den schon genannten Umsatzausfällen sollten dabei u.a. auch Reputationsschäden, verringerte Produktivität und Kosten der Wiederherstellung berücksichtigt werden. Drei Beispiele, die die Lücke zwischen Theorie und Praxis belegen soll:

– Welche Umsatzausfälle sind bei einem Webshop zu erwarten? Diese lassen sich anhand von Umsatzzahlen der Vergangenheit recht konkret abschätzen.

– Ab wann können Service Level Verträge (SLAs) mit Endkunden nicht mehr eingehalten werden? Neben Reputationsschäden können hier Kosten z.B. durch Vertragsstrafen entstehen.

– Was kostet es, wenn eine Kernanwendung wie ein ERP-System ausfällt und eine interne Abteilung mit 100 Mitarbeitern nicht arbeiten kann? Diese Kosten lassen sich nicht so einfach abschätzen.

Die Auswirkungen „klassischer“ IT-Vorfälle sind aus Erfahrungswerten bekannt und durch den Ausfall von Einzelsystemen leichter überschaubar. Diese wertvollen Informationen können dafür verwendet werden, abzuschätzen, was größere Ausfälle bewirken. Dabei sollte erfasst werden, was ein Serviceausfall für betroffene Personen, Prozesse und Kunden auf der „Zeitschiene“ bedeuten würde. Was sind die Auswirkungen von z. B. einer Stunde Nichterreichbarkeit einer Website, von vier Stunden Unterbrechung eines Produktionsprozesses X, oder von einem 24-stündigen Bruch eines SLA mit Endkunde Y? Die Kosten summieren sich entsprechend.

Zweiter Schritt: Die technischen Möglichkeiten und Kosten der DR-Lösung bestimmen:

Die mögliche Realisierung der Zielvorgaben für RPO und RTO hängen auch von technischen Gegebenheiten ab. Daher sollten zunächst die Abhängigkeiten zwischen geschäftskritischen Anwendungen, Betriebssystemen, Datenbanken sowie Middleware untersucht werden. Leitfragen sind hier unter anderem:

– Können Daten auf Ebene der Storagesysteme repliziert werden? Gibt es Schnittstellen zwischen Betriebssystem und Storagesystemen, um DR-Maßnahmen zu automatisieren?

– Bei vielen OpenSource-Produkten, wie z. B. MySQL, ist es nicht ohne weiteres möglich, RPO- und RTO-Vorgaben von = 0 zu realisieren. Werden kommerzielle Erweiterungen (also Firmen, die technische oder Service-Erweiterungen für Open Source Produkte anbieten) nötig, die einem ursprünglichen Einsatzziel von OpenSource entgegenstehen?

– Inwieweit kann Virtualisierung genutzt werden, um automatisierte Failover-Szenarien zu realisieren? Wie weit sind die Disaster-Recovery-Standorte voneinander entfernt? Physikalisch sind nur bestimmte Latenzen auf gewissen Distanzen zwischen Rechenzentren möglich.

– Welche Schnittstellen bestehen zu Cloud-Diensten? Gibt es eine performante Netzwerkverbindung zu Cloud-Diensten, um Failover-Szenarien zu realisieren?

Je genauer diese Fragen beantwortet werden, desto leichter fällt das Design einer technisch guten und wirtschaftlich ausgewogenen DR-Lösung.

„Der Katastrophenfall ist gegenüber einem „normalen“ IT-Systemausfall deshalb so kritisch, weil zum einen die gesamte IT- Infrastruktur betroffen ist und zum anderen die Wiederherstellung ohne vorher getroffene Vorkehrungen sehr lange dauern kann. Daher empfehlen wir eine gründliche Vorbereitung. Hinzu kommt, dass unabhängig von deren konkreter Höhe, die Kosten und technischen Einschränkungen mit den steigenden Anforderungen an RPO und RTO ebenfalls steigen. Vor allem RPO-Ziele von unter acht Stunden können teuer werden“, erklärt Dr. André Triebel, Business Solutions Consultant von Interoute.

Über Interoute Germany GmbH
Interoute ist Eigentümer und Betreiber einer der europaweit größten Cloud Services Plattformen. Sie umfasst ein Glasfasernetz mit einer Gesamtlänge von über 60.000 km, acht Rechenzentren für das Hosting von Daten und 32 für diesen Zweck errichtete Colocationzentren sowie Direktanbindungen an weitere 140 Rechenzentren von Partnern in Europa. Die umfassende Unified ICT-Plattform nutzen Unternehmen weltweit, darunter alle großen, etablierten europäischen Telekommunikationsunternehmen und alle großen Betreiber in den USA, Ost- und Südostasien, Institutionen des öffentlichen Sektors, und Universitäten. Sie alle sehen in Interoute einen idealen Partner für Computing, Konnektivität und Kommunikation sowie die Entwicklung neuer Services. Interoutes Unified ICT-Strategie hat sich bei Unternehmen bewährt, die eine skalierbare, sichere und leistungsfähige (unrestrained) Plattform für ihre Sprach-, Video-, IT- und Datendienste benötigen. Außerdem liefert sie Betreibern internationale Transit- und Infrastruktur-Dienste mit hoher Kapazität. Mit einem fest etablierten Geschäftsbetrieb in Europa, Nordamerika und Dubai ist Interoute darüber hinaus Besitzer und Betreiber moderner Stadtnetze in allen europäischen Geschäftsmetropolen. http://www.interoute.de

Kontakt
Interoute Germany GmbH
Christa Bramstedt
Albert-Einstein-Ring 5
14532 Kleinmachnow
030-25431 1422
Christa.Bramstedt@interoute.com
http://www.interoute.de

Pressekontakt:
PR Laxy
Arno Laxy
Nördliche Auffahrtsallee 19
80638 München
089 15929661
interoute@laxy.de
http://www.laxy.de