Artikel

IT und Business in Einklang bringen: Aufbau einer Zuverlässigkeitsstrategie für erfolgreiche SRE-Implementierungen

Balázs Nagy

Aktualisiert Oktober 10, 2025
5 Minuten

SRE ist eine Disziplin, die Software-Engineering und Betrieb kombiniert, um die Zuverlässigkeit und Leistung komplexer Systeme, einschließlich IT-Infrastrukturen, Anwendungen und Datenbanken, zu verbessern. Sie konzentriert sich auf den Aufbau und die Pflege skalierbarer, zuverlässiger und effizienter Systeme. Durch die Verringerung von Ausfallzeiten, die Verbesserung der Systemstabilität und die schnellere Erkennung und Lösung von Problemen trägt SRE zu einer verbesserten Kundenerfahrung, einer höheren Benutzerzufriedenheit und einem höheren Umsatzpotenzial bei. Allerdings ist SRE traditionell auf die technischen Teams beschränkt. Diese Trennung kann Unternehmen oft teuer zu stehen kommen, da die Geschäftsziele weit von der digitalen Infrastruktur entfernt sind, mit der die Benutzer oft direkt interagieren. Daher müssen IT- und Technik-Teams zusammenarbeiten, um eine Zuverlässigkeitsstrategie zu entwickeln, von der das gesamte Unternehmen profitiert.

In dieser Blogserie zeigen wir Ihnen, wie wichtig es ist, SRE aus der Unternehmensperspektive zu betrachten und was Sie davon haben. In unseren vorangegangenen Blogs haben wir die spezifischen Auswirkungen von SRE auf das Unternehmen erörtert und wie wir diese Auswirkungen messen können.

Der Aufbau einer soliden Reliability-Strategie hängt von der Schaffung einer gemeinsamen Sprache zwischen IT- und Business Performance-Teams ab. Um eine fruchtbare Grundlage für diese Strategie zu schaffen, müssen zwei Dinge geschaffen werden:

  • Verschaffen Sie sich Klarheit darüber, wie IT-Systeme den Geschäftswert unterstützen und liefern, indem Sie Wertstromanalysen, Customer Journey Mapping und Service Mapping durchführen.
  • Schaffen Sie eine abgestimmte Messung der Geschäfts- und IT-Leistung durch SLOs und SLIs

Verstehen, wie IT-Systeme die Geschäftsziele unterstützen:

Um SRE-Praktiken mit den Unternehmenszielen in Einklang zu bringen, ist es entscheidend zu verstehen, wie die Systemkomponenten das Kundenerlebnis behindern oder dazu beitragen. Dies kann erreicht werden, indem man die Systemkomponenten den Auswirkungen, die sie auf den Benutzer haben, zuordnet. Ein praktischer Ansatz hierfür ist das Value Stream Mapping und das Customer Journey Mapping.

Bei der Abbildung des Wertstroms geht es darum zu verstehen, wie einzelne Komponenten und das Gesamtsystem den Geschäftswert unterstützen und liefern. Im Falle einer E-Commerce-Website umfasst der Wertstrom beispielsweise Elemente wie die Suche nach Produkten, die Bestellung und die Bezahlung.

Wenn eine der drei Komponenten ausfällt, kann dies dazu führen, dass die Kunden das Produkt nicht kaufen können und folglich ein Umsatzrückgang zu verzeichnen ist.

Mit Hilfe von Wertstrom- und User Journey-Mapping können wir einen Ausgangspunkt schaffen, um zu verstehen, wie Systeme den Geschäftswert liefern, und ein einheitliches Verständnis und eine einheitliche Sprache zwischen Geschäfts- und IT-Stakeholdern fördern.

Für jeden Schritt auf der Customer Journey gibt es entsprechende Dienste, die diese Aktionen unterstützen. Beim Service Mapping geht es darum, diese Services zu identifizieren und abzubilden, um zu verstehen, wie sie zum gesamten Geschäftswert beitragen.

Im Falle der Suchfunktion können relevante Empfehlungen beispielsweise durch mehrere Dienste erreicht werden. Dazu könnte die Verwendung früherer Käufe gehören, um eine personalisierte Empfehlungsliste zu erstellen, oder Analysen, um die beliebtesten Produkte in der Suchkategorie zu präsentieren. Die Darstellung dieser Dienste hilft dabei, einen umfassenden Überblick darüber zu gewinnen, wie die Systeme einen geschäftlichen Nutzen liefern, und ermöglicht die Messung der Geschäfts- und IT-Leistung.

Lesen Sie hier, wie Sie mit Mapping eine gemeinsame Sprache zwischen IT- und Business-Teams schaffen können.

Ausgerichtete Messungen erstellen:

Traditionell erfolgt die Abstimmung zwischen dem Unternehmen und der erwarteten IT-Leistung durch die Definition nicht-funktionaler Anforderungen. Nichtfunktionale Anforderungen beziehen sich auf die Aspekte eines Systems, die sich nicht auf seine spezifische Funktionalität beziehen, sondern auf seine Gesamtleistung, Sicherheit, Zuverlässigkeit und andere Eigenschaften. Es gibt jedoch gute Gründe, diesen Ansatz in Frage zu stellen. Nicht-funktionale Metriken sind oft weit von den tatsächlichen Erfahrungen des Kunden entfernt und bieten daher keinen klaren Einblick in umsetzbare Verbesserungen.

Service-Level-Indikatoren (SLIs) und Service-Level-Ziele (SLOs) können uns dabei helfen, diese beiden Bereiche besser aufeinander abzustimmen.

Service Level Indicators (SLIs) sind zeitpunktbezogene Messungen einer bestimmten technischen Qualität eines Dienstes, die anzeigen, wie der Dienst funktioniert. SLOs definieren die gewünschte Servicequalität über einen bestimmten Zeitraum. Indem Unternehmen ihre Geschäftsziele mit aussagekräftigen SLIs und SLOs abstimmen, können sie eine einheitliche Vision für das System und eine insgesamt bessere Leistung sicherstellen.

Es ist wichtig, aussagekräftige SLIs und SLOs zu definieren, die relevante Indikatoren für die Leistung der Servicequalität und Frühwarnsignale für potenzielle Auswirkungen auf das Geschäft darstellen. Es ist notwendig, Geschäfts- und IT-Leistung aufeinander abzustimmen, indem SLOs als Stellvertreter für die Erfüllung von Geschäftszielen verwendet werden. Lesen Sie hier mehr über SLOs und SLIs.

Die Eckpfeiler einer gut definierten Zuverlässigkeitsstrategie liegen also im Verständnis der Art und Weise, wie IT-Systeme den Geschäftswert liefern, und in der Schaffung einer abgestimmten Messung der Geschäfts- und IT-Leistung. Diese Eckpfeiler können in kleinere Bausteine unterteilt werden, die verschiedene Konzepte, die berücksichtigt werden müssen, umreißen und miteinander verbinden.

Was sind unsere Ziele?
Das Verständnis der Geschäftsstrategie und der entsprechenden Geschäftsziele muss für die Geschäfts- und IT-Stakeholder klar sein, um eine erfolgreiche abteilungsübergreifende Zusammenarbeit zu gewährleisten.

Wo spielen wir?
Wenn Sie wissen, wie IT-Systeme den Geschäftswert liefern, können Sie feststellen, wo die Zuverlässigkeit entlang der Wertströme und User Journeys im Mittelpunkt stehen sollte.

Wie können wir gewinnen?
Die Schaffung eines abgestimmten Maßes für die Geschäfts- und IT-Leistung hilft uns zu bestimmen, wie wir die IT-Unterstützung nutzen können, um unsere Geschäftsziele zu erreichen.

Welche Fähigkeiten brauchen wir?

Um erfolgreich zu sein, sind viele Fähigkeiten erforderlich, wie z.B. die Beobachtbarkeit der Systeme und ihrer Komponenten. Die Klärung der erforderlichen Qualifikationen wird sicherstellen, dass wir darauf vorbereitet sind, die benötigten Einblicke zu erhalten.

Welche Unterstützung wird benötigt:

Neben den geschäftlichen und technischen Aspekten müssen auch die unterstützenden Elemente der SRE-Implementierung definiert werden. So kann zum Beispiel die Schulung von Geschäfts- und IT-Akteuren und Ingenieuren erforderlich sein, um eine reibungslose Leistung zu gewährleisten.

Aufbauend auf diesen Eckpfeilern sollten Unternehmen in der Lage sein, eine Zuverlässigkeitsstrategie zu entwickeln. Dies ist unserer Meinung nach die Voraussetzung für eine erfolgreiche und nachhaltige SRE-Implementierung mit aussagekräftigen, messbaren und greifbaren Ergebnissen, sowohl aus technischer als auch aus geschäftlicher Sicht.

Möchten Sie mehr über Site Reliability Engineering erfahren? Besuchen Sie unsere Seite über den Service Site Reliability Engineering.

Contact

Let’s discuss how we can support your journey.