Artikel
Schlüsselkennzahlen zur Bewertung der geschäftlichen Auswirkungen von SRE

Site Reliability Engineering (SRE) ist eine wichtige Disziplin, die Softwaretechnik und Betrieb kombiniert, um die Zuverlässigkeit und Leistung komplexer Systeme zu verbessern. SRE mag ein technisches Thema sein, aber es hat einen weitreichenden und nachhaltigen Einfluss auf die Unternehmensleistung, die Kundenerfahrung und das Umsatzwachstum.
In dieser Blogserie zeigen wir Ihnen, wie wichtig es ist, SRE aus der Unternehmensperspektive zu diskutieren, und was Sie davon haben. In unserem letzten Blog haben wir die spezifischen Auswirkungen von SRE auf das Unternehmen erörtert. In diesem Blog werden wir uns darauf konzentrieren, wie wir diese Auswirkungen messen können.
Geschäftsziele und KPIs
Die Unternehmensleistung wird häufig anhand von Unternehmenszielen und den dazugehörigen Leistungskennzahlen (Key Performance Indicators - KPIs) gemessen. Sie sind vorgegebene Ziele und Kontrollpunkte, die die Richtung des Unternehmens vorgeben.
Für eine E-Commerce-Website können die KPIs zum Beispiel Folgendes umfassen:
- Anzahl der täglichen Besuche
- Durchschnittliche Verweildauer auf der Website
- Erzielte Gesamteinnahmen
- Kennzahlen zu Konversion und Kundenbindung
Es gibt zahlreiche Möglichkeiten, KPIs den Wertströmen einer Website zuzuordnen. Betrachten wir ein einfaches Beispiel: Ein Webshop muss Systeme zum Suchen, Bestellen und Bezahlen von Produkten aufbauen. Dies sind die Elemente des Wertstroms.
Beispiel: Produktsuche als KPI-Treiber
Es ist wichtig, dass Kunden Produkte schnell finden. Zu viele Suchvorgänge können zu Frustration, Kaufabbrüchen und Umsatzeinbußen führen. Daher könnte ein relevanter KPI in diesem Szenario die Verkürzung der Suchzeit sein.
Suchdienste und Wertströme
- Einfache Produktsuche - wenn Kunden das genaue Produkt kennen (z.B. "rosa Handytasche")
- Top 10 Produkte in einer Kategorie - wenn Kunden den Typ (z.B. "Handyhülle") kennen, aber nicht den genauen Typ
- Relevante Empfehlungen - wenn Kunden vor kurzem ein Telefon gekauft haben und möglicherweise entsprechendes Zubehör benötigen
Service Level Indikatoren (SLIs)
Was sind SLIs?
Service Level Indicators (SLIs) sind zeitpunktbezogene Messungen der technischen Qualität eines Dienstes. Die vier häufigsten SLIs (Golden Signals) sind:
- Latenzzeit: Zeit zur Bearbeitung einer Anfrage
- Fehlerquote: Prozentsatz der fehlgeschlagenen Anfragen
- Durchsatz: Anzahl der bearbeiteten Anfragen pro Zeiteinheit
- Sättigung: Ressourcennutzung durch eine Anfrage
Warum SLIs wichtig sind
In unserem Webshop-Beispiel:
- Einfache Produktsuche → Latenz ist ein kritischer SLI (Zeit für die Anzeige der Ergebnisse)
- Empfehlungen Service → Fehlerquote ist ein kritischer SLI (Häufigkeit von Ausfällen oder fehlenden Ergebnissen)
Schlechte SLIs (hohe Latenz oder Fehlerrate) verschlechtern das Benutzererlebnis und verringern KPIs wie Engagement, Konversionen und Umsatz.
Service Level Zielsetzungen (SLOs)
Was sind SLOs?
Service Level Objectives (SLOs) definieren die angestrebte Servicequalität im Laufe der Zeit. Jeder SLI sollte einen entsprechenden SLO haben, um zu messen, ob die Leistung den Geschäftsanforderungen entspricht.
Beispiele für SLOs
- Einfache Suche: 98% der Suchanfragen müssen innerhalb von 1 Sekunde Ergebnisse liefern (rollierend 60 min).
- Empfehlungen: 97 von 100 Serviceaufrufen müssen erfolgreich zu Ergebnissen führen.
Aussagekräftige SLIs und SLOs definieren
Aussagekräftige SLIs und SLOs müssen sein:
- Relevant: Direkt mit den Geschäftsergebnissen verbunden
- Gut definiert: Leicht zu verfolgen, konsistent, messbar
- Proaktiv: Frühwarnsignale bei Leistungsproblemen
Eine Antwortzeit von 1 Sekunde für 98% der Suchvorgänge ist zum Beispiel eine vernünftige Erwartung. Wenn Sie dies über ein rollierendes 60-Minuten-Fenster verfolgen, können Sie Trends bei der Zuverlässigkeit und der Benutzerfreundlichkeit erkennen.
Business- und IT-Leistung in Einklang bringen
Traditionell wurde die Anpassung anhand von nicht-funktionalen Anforderungen (NFRs) vorgenommen. Aber NFRs führten oft zu übertechnisierten Systemen oder zu Systemen, die die technischen Spezifikationen erfüllten, ohne einen echten Kundennutzen zu bieten.
Durch die Definition von SLIs und SLOs, die auf die Unternehmensziele abgestimmt sind, können Unternehmen:
- Verbinden Sie die IT-Leistung direkt mit den Geschäftsergebnissen
- Identifizieren Sie Zuverlässigkeitsrisiken, bevor sie sich auf den Umsatz auswirken
- Überbrücken Sie die Kluft zwischen Geschäftsführern und technischen Teams
Schlussfolgerung: Warum SRE für Unternehmensleiter wichtig ist
Wenn Führungskräfte SRE verstehen, werden IT- und Geschäftsziele nahtlos aufeinander abgestimmt. Diese Abstimmung verbessert die Systemzuverlässigkeit, die Kundenzufriedenheit und die Umsatzergebnisse.
Nächster Schritt: Möchten Sie mehr über Site Reliability Engineering erfahren? Informieren Sie sich über unsere Beratungsdienste für Site Reliability Engineering und unsere SRE-Schulungsprogramme.
Unsere Ideen
Weitere Artikel

War die Linksverschiebung der richtige Schritt?
Erfahren Sie, wie die Linksverschiebung bei DevOps die Teamleistung steigert, die kognitive Belastung reduziert und die Arbeit der Entwickler durch...
Sander Aernouts

Drei häufige Fallstricke bei der Plattformentwicklung und wie Sie sie vermeiden...
Entdecken Sie 3 Fallstricke im Platform Engineering und erfahren Sie, wie Sie diese vermeiden können, um Produktivität, Innovation und langfristigen...
Jelmer de Jong
Contact