Maßgeschneiderte Monitoring-Systeme
31. Dezember 2018Vor einigen Jahren hatte ich ein Meeting mit den Verantwortlichen für das Network Operations Center – diejenigen, die nachts um zwei Uhr auf Probleme reagieren – und sagte: „Erzählt mir von euren geheimen Monitoring- Wünschen. Welche Daten würden euch so richtig glücklich machen?“. Er antwortete: „Es wäre super, wenn wir Warnungen bekämen, wenn nicht routingfähige Schnittstellen ausfallen.“ Ich winkte ab. „Ja, natürlich. Aber was wollt ihr wirklich?“. „Nein, im Ernst“, sagte er. „Wenn das möglich wäre, würde das für uns alles ändern. Wir fragen schon seit fünf Jahren immer wieder danach, aber bisher hat es niemand hingekriegt.“ Seitdem habe ich häufig Ähnliches erlebt.
Heutzutage bin ich besser darauf vorbereitet, wenn ein Gespräch sich in eine solche Richtung entwickelt, aber bestürzt bin ich immer noch. Denn gerade als IT-Experten fällt es uns sehr schwer, in irgendeinem Bereich eine nicht perfekte Performance oder suboptimale Funktionen zu akzeptieren. Wir rooten unsere Smartphones, um die neueste Version des Betriebssystems nutzen zu können. Wir übertakten unsere Systeme. Wir senden Bugfixes und Feature-Anfragen an Softwareanbieter. Wir nutzen Hintertüren. Warum also treffe ich so häufig anspruchsvolle Netzwerktechniker und Systemadministratoren, die es passiv hinnehmen, dass ihre Überwachungslösungen überhaupt nicht ihren Anforderungen entsprechen?
Die Ergebnisse des SolarWinds IT Trends Report: The Intersection of Hype and Performance von 2018 bestätigen meine Beobachtungen. Mehr als die Hälfte der über 800 befragten IT-Fachkräfte sagten, dass ihre IT-Umgebungen nicht optimal funktionierten. Ein ähnlicher Prozentsatz gab an, weniger als 25 Prozent ihrer Zeit mit dem Versuch zu verbringen, bereits vorhandene Systeme zu optimieren. Cloud, Container und hybride IT gehören inzwischen zum Alltag. Digitale Transformation, künstliche Intelligenz und maschinelles Lernen werden zu Schlagworten im Munde jeder Führungskraft und im Kopf jedes technischen Leiters. Doch immer noch schlagen sich zu viele Leiter von Rechenzentren mit Tools rum, die nicht nur wenig benutzerfreundlich sind, sondern teilweise geradezu benutzerfeindlich.
Monitoring-Implementierungen können typischerweise in zwei grundlegende Kategorien unterteilt werden: Selbstentwickelte und projektbezogene Überwachungslösungen. In beiden Fällen besteht eine hohe Wahrscheinlichkeit, dass das Endergebnis nicht gerade erstklassig sein wird. Selbstentwickelte Überwachungslösungen entstehen meist als inoffizielles und billiges Nebenprojekt. Sobald die Person ein Ergebnis erreicht hat, das „erst mal gut genug“ ist, wird das Projekt abgeschlossen. Die Lösung wird kaum je verändert und Verbesserungen unterzogen und falls sie Systeme überwacht, die über die ursprünglichen Anforderungen jener Einzelperson oder des Teams, das die Entwicklung veranlasst hat, hinausgehen, erfolgt dies meist, um jemandem einen Gefallen zu tun.
Am anderen Ende des Spektrums befinden sich Überwachungslösungen für Unternehmensprojekte. Meistens werden sie aufgrund irgendeiner Verordnung des Managements angeschafft und am Ende wird ein Tool ausgewählt, das weder einfach zu benutzen noch kostengünstig ist. Dieses Tool wird auf Zwang in allen möglichen Situationen angewendet, für die es eigentlich nie gedacht war, denn schließlich hat es viel Geld gekostet und das muss sich ja irgendwie lohnen. Die Teams, die aufgefordert werden, das Tool zu nutzen, haben selten wirklich Interesse daran oder nutzen vielleicht sogar bereits eigene Lösungen, von denen sie finden, dass sie ihren Anforderungen besser entsprechen.
Ein weiterer Faktor bei selbstentwickelten Lösungen und projektbezogenen Überwachungslösungen sind Wissen und Umfang. Es ist nicht einfach, Spezialisten aus unterschiedlichen Teams dazu zu bringen, sich auf eine Reihe von Überwachungsmetriken zu einigen. Genauso schwierig ist es, Monitoring-Experten zu finden, die in verschiedenen Bereichen bewandert sind und die Lücke füllen können. Die Überwachungsoptionen, die den meisten Technikern zur Verfügung stehen, sind also in beiden Fällen meistens wenig geeignet, arm an Funktionen und schlecht gefördert.
Das ist eine bittere Wahrheit. Die Überwachung – eine solide, effektive, robuste, zuverlässige Überwachung, die nicht nur die grundlegenden Anforderungen, sondern auch darüberhinausgehende Anliegen mehrerer Teams im Unternehmen erfüllt – ist eine komplizierte Sache. Sie erfordert üblicherweise mehrere Tools, häufig von unterschiedlichen Anbietern. Doch auch davon abgesehen ist es schwierig, die richtigen Teams zusammen und die richtigen Gespräche in Gang zu bringen und sowohl während der Implementierungsphase als auch bei der späteren Nutzung eine hohe Fachkompetenz sicherzustellen, damit die Lösung auch effektiv eingesetzt werden kann. Es ist so schwierig, dass viele IT-Experten den Status Quo akzeptieren, weil sie den Eindruck haben, dass zu viele Variablen nicht in ihrer Hand liegen.
Die Überwachung kann für jedes Unternehmen zu einem leistungsstarken Werkzeug werden. Sie macht es möglich, Ausfallzeiten, Leistungsabfälle und damit einhergehende Kosten zu vermeiden und dient als Ansporn für Ingenieure, die sich auf mehr als nur ihre eigenen Augen und ihr Bauchgefühl verlassen wollen, um zu wissen, dass alles in Ordnung ist – und wenn mal etwas nicht stimmt, führen die Überwachungsdaten schnell und zielgenau zur zugrunde liegenden Ursache von Problemen. Das alles klingt vielversprechend – und es ist nicht unerreichbar.
Leon Adato, Head Geek bei SolarWinds