Mehr als ein IT-Problem – das Ziel „Null Ausfallzeit“
25. Januar 2021Die Relevanz der Ausfallzeit von IT-Systemen wird oft erst deutlich, wenn die Probleme akut sind. Die Praxis zeigt: Die meisten Unternehmen können nicht mehr als eine Stunde Ausfallzeit für geschäftskritische Anwendungen relativ problemlos verkraften. Die geschätzte durchschnittliche Zeit für die Wiederherstellung beträgt jedoch mehr als sechs Stunden.
Die effiziente Sicherung und Wiederherstellung kritischer Daten und Anwendungen ist unerlässlich. Und sie ist notwendig, wenn Unternehmen einen echten geschäftlichen Nutzen aus ihren geschützten Daten ziehen wollen. Strenge Service Level Agreements (SLAs) und immer kürzer werdende Recovery Time Objectives (RTOs) stellen jedoch eine enorme Herausforderung dar, wenn die Rechenzentrumsstrategie mehrere Plattformen und Technologien umfasst. Um diese Anforderungen zu erfüllen, gehen immer mehr Unternehmen zu hybriden und datenintelligenten Infrastrukturen über.
Datensicherungstechnologien und -prozesse bedeuten nichts ohne klare Ziele. Unternehmen müssen daher hierfür die Ziele festlegen und mit ihren bestehenden Geschäfts- und IT-Zielen abstimmen. Dann gilt es messen und feinjustieren, um sich im Laufe der Zeit zu verbessern. Das Verständnis für reale Datensicherungs- und Verfügbarkeits-SLAs wird immer wichtiger. Nicht nur für IT-Fachleute, sondern auch für die Technologieunternehmen, die die Tools bereitstellen.
Die Enterprise Strategy Group (ESG) befragte kürzlich fast 400 IT-Fachleute, die in US-amerikanischen und kanadischen Unternehmen für die Datensicherung verantwortlich oder daran beteiligt sind. Das Ziel: ein besseres Verständnis ihrer Fähigkeit, Anwendungs- und Workload-SLAs zu erfüllen. Die ESG wollte sich ein klareres Bild über den Zustand der Endbenutzer-Implementierungen machen, Lücken identifizieren und zukünftige Erwartungen aufzeigen. Die Studie bewertete auch die Toleranz gegenüber Ausfallzeiten, Ausfallzeit-Metriken und reale SLAs im Kontext tatsächlicher Datenverluste und vor dem Hintergrund von Verfügbarkeitstechnologien und -methoden, einschließlich hybrider Umgebungen.
Die meisten Unternehmen weisen eine SLA-Lücke – das Delta zwischen ihren angegebenen SLAs und der Fähigkeit, sie zu erfüllen – auf, die ihre Fähigkeit, die RTOs einzuhalten, stark beeinträchtigt. Die Auswirkungen reichen über den IT-Betrieb hinaus bis in das Business. Viele Teilnehmer, die Anwendungsausfallzeiten erlebten, berichteten auch über:
- Umsatzeinbußen,
- Rückgang des Kundenvertrauens und
- Beeinträchtigung der Markenintegrität,
Die meisten Unternehmen gaben an, dass sie bei geschäftskritischen Anwendungen nicht mehr als eine Stunde Ausfallzeit verkraften können. Die geschätzte durchschnittliche Zeit für die Wiederherstellung betrug jedoch mehr als sechs Stunden.
Die Studie zeigte auch überraschende Trends in Bezug auf Business-Continuity- und Disaster-Recovery-Tests. Nur eines von vier Unternehmen hatte wöchentliche Tests implementiert. Tatsächlich testet die Mehrheit der Unternehmen monatlich – oder noch seltener.
Angesichts der Häufigkeit von Cyber-Angriffen, Ransomware und anderen Problemen, die die Infrastruktur lahmlegen, ist dies ein gefährliches Risiko. Häufigeres Testen ermöglicht es, Probleme schneller zu identifizieren und zu beheben und die Datensicherungsstrategie zu verfeinern, bevor Ausfallzeiten zu einem Problem werden. Unternehmen wollen sicher nicht, dass ihr erster Test dieser Strategie ein Live-Ereignis ist, das zu Schäden führt.
Die ESG-Studie liefert weitere Informationen zu Themen:
- Wie Cloud-basierte Anwendungen herkömmliche On-Premises-Implementierungen in Bezug auf die Erfahrung und Wahrnehmung der Wiederherstellbarkeit herausfordern.
- Unterschiede bei den Wiederherstellungszielen (Recovery Point Objective, RPO), die bei Software-as-a-Service-Anwendungen bestehen.
- Wie Datensicherungs-, Business-Continuity- und Disaster-Recovery-Prozesse zunehmend mit der Cloud integriert werden. (rhh)