Artikel
Überwachung der nächsten Generation: Zeitreise für AIOps

Die Ursachenforschung und Fehlerbehebung in der gesamten IT-Umgebung ist eine schwierige Aufgabe, da die heutigen Infrastrukturen und Anwendungen sowohl vor Ort als auch in der Cloud betrieben werden und von Natur aus elastischer, dynamischer und verteilter sind.
Wenn ein Problem auftritt, erhalten mehrere Teams eine Flut von Warnmeldungen und müssen von Tool zu Tool springen, um die Ursache des Problems zu finden. Technologische und organisatorische Grenzen erschweren den Prozess, ein vollständiges Bild der Vorgänge zu erstellen, zusätzlich. Das ist eine ziemliche Herausforderung, wenn man bedenkt, dass die moderne IT-Umgebung einem ständigen Wandel unterliegt.
Kommt Ihnen das bekannt vor? Ich wette, Sie sind nicht allein.
Die Fehlersuche sollte nicht mühsam sein. Wir von StackState möchten die Ursachenforschung bei Problemen in der IT-Umgebung beschleunigen und vereinfachen. Probleme in der IT-Umgebung können in der Regel auf Änderungen zurückgeführt werden. Ein vollständiges Änderungsprotokoll für die gesamte IT-Umgebung ist daher unerlässlich.
Aus diesem Grund haben wir eine Zeitreisefunktion für Anwendungen und Infrastrukturen im Unternehmensmaßstab entwickelt. Lassen Sie mich Ihnen eine Einführung in diese aufregende Fähigkeit der StackState Überwachungs- und AIOps-Plattform der nächsten Generation geben.
Einführung in die Zeitreisefunktion von StackState
Die Grundlage unserer Zeitreisefunktion ist die vollständige Persistenz des 3T-Datenmodells (Topologie, Telemetrie und Zeit) einschließlich aller historischen Änderungen und Ereignisse. Mit diesen 3 Bestandteilen können Sie eine Echtzeit-Replik Ihrer IT-Umgebung erstellen, um Abhängigkeiten zu verstehen und den Zustand jeder Komponente in Ihrer Umgebung zu visualisieren.Bei StackState haben wir unsere eigene versionierte Graphdatenbank entwickelt, um dieses Modell zu unterstützen. Sie gibt unseren Benutzern die Möglichkeit, jede Änderung und jedes Ereignis als Schnappschuss zu speichern und im Detail zu verfolgen, wie die verschiedenen Komponenten Ihrer Umgebung im Laufe der Zeit beeinflusst wurden. Insbesondere in Unternehmensumgebungen ist es wichtig zu verstehen, in welchem Zustand sich das gesamte System befand, als ein bestimmtes Problem auftrat.
Die Zeitreisefunktion in StackState hilft Ihnen dabei:
- Verstehen Sie sofort die Ursache und die Auswirkungen jedes einzelnen Ereignisses im Laufe der Zeit. Jetzt können Sie mit der Korrektur beginnen, anstatt nach der Ursache zu suchen.
- Behebung von Problemen durch eine einzelne Person oder ein Team. Verabschieden Sie sich endlich von War Rooms und sparen Sie wertvolle Zeit und Ressourcen.
- Verkürzen Sie Ihre MTTR und liefern Sie bessere Kundenerlebnisse. Stellen Sie sicher, dass Sie Ihre Anwendungs-SLAs einhalten und eine stabile Infrastruktur bereitstellen.
Gehen Sie zurück in die Zeit
OK - und wie funktioniert es? StackState ist in der Lage, Ihre gesamte IT-Landschaft automatisch zu entdecken, abzubilden und zu überwachen. Standardmäßig zeigt StackState immer die aktuelle Situation an, so dass die Teams wissen, was gerade passiert, aber es hat auch ein großes Gedächtnis. 
StackState zeichnet alle Änderungen an Ihrer gesamten IT-Landschaft auf und ermöglicht es Ihnen, in der Zeit zurückzureisen. So können Sie die Ursachen von Fehlern analysieren und interaktive Post-Mortems durchführen, indem Sie alle Änderungen, die sich auf Ihre Landschaft auswirken, zurückverfolgen.
Die Zeitreisefunktion in Aktion:
Wie Sie sehen können, zeigt die Zeitleiste unterhalb der Topologieansicht an, wann die aktuelle Ansicht aufgenommen wurde, und enthält eine Aufzeichnung der Ereignisse und Zustandsänderungen, die zu einem bestimmten Zeitpunkt eingetreten sind. Wenn Sie auf eine beliebige Stelle in der Zeitleiste klicken, können Sie zu diesem Zeitpunkt reisen und die Ereignisse und Metriken des ausgewählten Zeitraums anzeigen.
Stellen Sie sich eine IT-Landschaft vor, die aus Anwendungen besteht, die alle voneinander abhängen, zum Beispiel in einer containerisierten Microservices-Architektur. Ein Problem irgendwo in der Landschaft führt zum Ausfall einer beliebigen Anzahl abhängiger Anwendungen. Diese Situation ist fast unmöglich zu diagnostizieren, es sei denn, Sie kennen die Abhängigkeiten zwischen den Komponenten und sind in der Lage, die Entwicklung im Laufe der Zeit nachzuvollziehen. Diese Topologie- und Zeitreisefunktion ist eine der wichtigsten Funktionen von StackState.
Probleme an der Wurzel zu packen, muss kein komplizierter Prozess sein. Mit einer modernen AIOps-Plattform wie StackState können Kunden ihre Zeit damit verbringen, innovative Funktionen zu entwickeln und erstklassige Dienste bereitzustellen, anstatt nur die Lichter am Leuchten zu halten.
Unsere Ideen
Weitere Artikel

War die Linksverschiebung der richtige Schritt?
Erfahren Sie, wie die Linksverschiebung bei DevOps die Teamleistung steigert, die kognitive Belastung reduziert und die Arbeit der Entwickler durch...
Sander Aernouts

Drei häufige Fallstricke bei der Plattformentwicklung und wie Sie sie vermeiden...
Entdecken Sie 3 Fallstricke im Platform Engineering und erfahren Sie, wie Sie diese vermeiden können, um Produktivität, Innovation und langfristigen...
Jelmer de Jong
Contact


