Rechtliches & Compliance

Was ist ein Service Level Indicator (SLI)?

Autor: Ioana Grigorescu, Content Managerin

Geprüft von: George Ploaie, Chief Operating Officer (COO)

Was ist ein SLI (Service Level Indikator)?

Was ist ein Service Level Indicator (SLI)?

Ein Service Level Indicator (SLI) ist ein quantitatives Maß für die Qualität oder Zuverlässigkeit eines Dienstes. SLIs spiegeln die Benutzererfahrung wider, wobei sie sich auf Aspekte wie Anfrageerfolg, Latenz oder die Korrektheit der Datenlieferung konzentrieren. Gängige SLI-Kategorien umfassen Verfügbarkeit, Latenz, Durchsatz, Fehlerrate, Dauerhaftigkeit, Aktualität und Korrektheit. Betrachten Sie einen SLI als eine Rohmessung, wie einen Tacho, die SLOs und folglich SLAs informiert.

Wie stehen SLIs in Beziehung zu SLOs und SLAs?

Obwohl verwandt, dienen die Konzepte von SLOs, SLIs und SLAs unterschiedlichen Zwecken und befinden sich auf verschiedenen Hierarchieebenen.

  •   Hierarchie: Diese Hierarchie stellt sicher, dass die technischen Bemühungen sowohl den Kundenerwartungen als auch der allgemeinen Geschäftsrisikotoleranz entsprechen.
  •   Zweck: SLIs selbst sind keine Ziele; sie liefern den Nachweis, um festzustellen, ob die SLO-Ziele erreicht werden.
  •   Brücke: Fehlerbudgets bieten eine praktische Brücke zwischen SLOs und der Release-Geschwindigkeit.

Konzept

Definition

SLI

Die Rohmesswerte der Service-Performance.

SLO

Die Ziele für diese Messungen (akzeptable Schwellenwerte) liegen über einem bestimmten Zeitfenster.

SLA

Die vertraglichen Verpflichtungen gegenüber Kunden basieren oft auf diesen Zielen und umfassen Strafen.

 

Wie wählen Sie relevante SLIs aus?

Hier sind einige Punkte, die Sie bei der Auswahl der für Sie relevanten SLIs beachten sollten:

  1. Denken Sie an die wichtigste Nutzerreise oder Fähigkeit Ihres Nutzers oder Dienstes.
  2. Wählen Sie diejenigen aus, die die Erfolgsperspektive des Nutzers am besten widerspiegeln. Wählen Sie diejenigen mit einem sehr klaren Einfluss auf die Nutzerzufriedenheit.
  3. Holen Sie sich den Input von den drei Abteilungen: Entwicklung, Produkt und Support, die wahrscheinlich unterschiedliche Ansichten haben werden.
  4. Legen Sie zunächst 2-3 wesentliche SLIs fest; aktualisieren Sie diese regelmäßig, wenn sich Ihr Produkt, Ihre Architektur oder die Benutzererwartungen ändern.

Wie definieren SLIs Leistungsschwellen?

Normalerweise definieren SLIs Leistungsschwellenwerte. Die unterstützenden Parameter sind:

  •   Werte: Sollten mit der wahrgenommenen Qualität des erbrachten Services übereinstimmen.
  •   Konformität: Über einen festgelegten Zeitraum können diese Metriken verwendet werden, um die Einhaltung von Service Level Agreements zu ermitteln.
  •   Benchmark: Ein Schwellenwert könnte „p95 Anmelde-Latenz unter 200 ms“ sein, was ein genaues Leistungsniveau zur Bewertung liefert.
  •   Warnungen: Diese Schwellenwerte sind die Grundlage für SLO-Warnungen, wenn sie verletzt werden. Ein SLO-Fehler wird genau zu diesem Zeitpunkt erfasst.

Wie messen SLIs Verfügbarkeit, Latenz und Fehler?

Bei der Messung von SLIs ist Folgendes zu beachten:

  1. Verfügbarkeit: Dies ist binär – ist der Dienst betriebsbereit oder nicht? (z.B. Betriebszeit geteilt durch Gesamtzeit).
  2. Latenz: Die Antwortzeit ist die betrachtete Metrik. Ein Beispiel kann die p95-Antwortzeit sein.
  3. Fehler: Die Messung der Häufigkeit fehlgeschlagener Anfragen könnte durch die Bestimmung des Verhältnisses von fehlgeschlagenen zu gesamten Anfragen erfolgen. ​‍​‌‍​‍‌​‍​‌‍​‍‌
Profi-Tipps:
  • Definieren Sie klar die Kriterien dafür, was als “gutes” oder “gültiges” Ereignis gilt.
  • Messen Sie, wenn möglich, aus der Perspektive des Nutzers.

Wie spiegeln SLIs die Datenqualität wider?

SLIs in Datensystemen werden zur Bewertung verwendet (primär, ob Daten aktuell, genau, vollständig und beständig sind). Sie spiegeln die Gesamtqualität der Daten wider. Datenqualitäts-SLIs bilden den Kern einer effektiven Überwachung und stellen sicher, dass Datenpipelines, Datensätze und andere Datenressourcen für Analysen, Berichte und KI/ML-Workflows geeignet sind.

Beachten Sie:

Ziehen Sie die Einbeziehung von Herkunfts- und Validierungsprüfungen in Betracht, um Datenqualitäts-SLIs zu unterstützen und detailliertere Einblicke zu ermöglichen. 

Wie häufig sollten SLIs gemessen werden?

Um signifikante Änderungen in der Serviceleistung zu erkennen, sollten SLIs häufig genug durchgeführt werden (aber auch so, dass Rauschen reduziert und die Sensibilität nicht verloren geht). Die passende Messhäufigkeit hängt vom spezifischen Service, dem definierten Fehlerbudget und dem Grad der Beeinträchtigung der Benutzererfahrung ab.

Gängige Intervalle:

  •   Kontinuierliche oder nahezu Echtzeit-Erfassung
  •   Aggregierte Zeitfenster von 1 Minute, 5 Minuten oder länger.
  •   Die angemessenen Intervalle liegen zwischen 10 Sekunden und mehreren Minuten.

Was ist Social Proof und wie lässt er sich auf SaaS anwenden?

Social Proof ist eine beliebte psychologische Taktik, bei der Menschen Benutzerfeedback und -eindrücke berücksichtigen, um verschiedene Kaufentscheidungen zu treffen.
SaaS-Unternehmen nutzen Social Proof, um zu demonstrieren, dass ihre Produkte positive Erfahrungen liefern und auf die Anforderungen der Benutzer eingehen.
Der Aufbau von Vertrauen ist entscheidend für SaaS-Unternehmen, da Kunden eher nach langfristigen Lösungen als nach einmaligen Käufen suchen.

Was sind gängige SLI-Metriken?

Beachten Sie die folgenden Punkte:

  1. Golden Signals: Latenz, Traffic/Durchsatz, Fehler und Sättigung werden häufig als SLIs verwendet.
  2. Nutzerorientierte Dienste: Üblicherweise reichen Verfügbarkeit, Latenz, Fehlerrate und Durchsatz aus, um die Leistung zu beurteilen.
  3. Datensysteme: Solche Systeme erfordern Metriken, die Aktualität, Korrektheit und Dauerhaftigkeit messen.
  4. Strategie: Im Allgemeinen ist es am besten, eine Handvoll wichtiger SLIs für jeden Service zu wählen, um Rauschen zu reduzieren und den Overhead zu begrenzen.

 Speziell für Zahlungen sollten Sie die folgenden in Betracht ziehen: 

  • Zahlungsautorisierungsrate: Das Verhältnis von erfolgreichen Autorisierungen zu den gesamten Versuchen (Korrektheit/Erfolg).
  • Kaufabwicklung Ladezeit: Die Zeit, die die gehostete Checkout-Seite benötigt, um interaktiv zu werden (Latenz).
  • Webhook-Zustellungsaktualität: Die Verzögerung zwischen einer erfolgreichen Zahlung und dem Eingang der Benachrichtigung auf dem Server des Anbieters (Aktualität/Latenz).

Schlussfolgerung

Service Level Indicators (SLIs) stellen wichtige quantitative Indikatoren für Qualität und Zuverlässigkeit aus der Perspektive des Benutzers dar. Durch die kluge Auswahl und Messung von SLIs wie Verfügbarkeit, Latenz und Fehlerraten kann das Team Leistungsschwellen festlegen, den Support planen und die Datenqualität aufrechterhalten.

Bereit anzufangen?

Wir haben die gleiche Reise hinter uns. Nutzen Sie unsere 18-jährige Erfahrung und verwirklichen Sie Ihre globalen Träume.
Mosaikbild
de_DEDeutsch