Juridisch en Compliance

Wat is een Service Level Indicator (SLI)?

Auteur: Ioana Grigorescu, Contentmanager

Beoordeeld door: George Ploaie, Chief Operating Officer (COO)

Wat is een SLI (Service Level Indicator)?

Wat is een Service Level Indicator (SLI)?

Een Dienstniveau-indicator (SLI) is een kwantitatieve maatstaf voor de kwaliteit of betrouwbaarheid van een dienst. SLI's weerspiegelen de gebruikerservaring, waarbij de focus ligt op aspecten zoals het succes van aanvragen, latentie of de correctheid van gegevenslevering. Veelvoorkomende SLI-categorieën zijn beschikbaarheid, latentie, doorvoer, foutenpercentage, duurzaamheid, actualiteit en correctheid. Beschouw een SLI als een ruwe meting, zoals een snelheidsmeter, die SLO's en, daaruit voortvloeiend, SLA's informeert.

Hoe verhouden SLI's zich tot SLO's en SLA's?

Hoewel ze met elkaar samenhangen, dienen de concepten van SLO's, SLI's en SLA's verschillende doelen en bevinden ze zich op verschillende hiërarchische niveaus.

  •   Hiërarchie: Deze hiërarchie zorgt ervoor dat technische inspanningen aansluiten bij zowel klantverwachtingen als de algemene bedrijfstolerantie voor risico's.
  •   Doel: SLI's zijn zelf geen doelen; ze leveren het bewijs om te bepalen of SLO-doelen worden gehaald.
  •   Brug: Foutbudgetten bieden een praktische brug tussen SLO's en releasesnelheid.

Concept

Definitie

SLI

De ruwe metingen van de serviceprestaties.

SLO

De doelen voor die metingen (acceptabele drempels) beslaan een specifieke tijdsperiode.

SLA

De contractuele verplichtingen aan klanten zijn vaak gebaseerd op die doelen en omvatten boetes.

 

Hoe kies je relevante SLI's?

Hier zijn enkele punten om in gedachten te houden bij het selecteren van voor u relevante SLI's:

  1. Denk aan de belangrijkste gebruikersreis of functionaliteit van uw gebruiker of dienst.
  2. Kies degene die het beste het succes vanuit het perspectief van de gebruiker weergeven. Selecteer degene met een zeer duidelijke impact op de gebruikerstevredenheid.
  3. Verzamel input van de drie afdelingen: engineering, product en support, die waarschijnlijk verschillende standpunten zullen hebben.
  4. Bepaal om te beginnen 2-3 essentiële SLI's; werk ze periodiek bij naarmate uw product, architectuur of gebruikersverwachtingen veranderen.

Hoe definiëren SLI's prestatiedrempels?

Meestal definiëren SLI's prestatietresholds. De ondersteunende parameters zijn:

  •   Waarden: Moet aansluiten bij de waargenomen kwaliteit van de geleverde dienst.
  •   naleving: Over een bepaalde periode kunnen deze meetgegevens worden gebruikt om de naleving van de service level agreement (SLA) te bepalen.
  •   Benchmark: Een drempelwaarde kan “p95 login latency onder 200 ms” zijn, wat een exact prestatieniveau biedt om tegen te evalueren.
  •   Waarschuwingen: Deze drempels vormen de basis voor SLO-waarschuwingen wanneer ze worden overtreden. Een SLO-overschrijding wordt specifiek op dat moment geregistreerd.

Hoe meten SLI's beschikbaarheid, latentie en fouten?

Denk bij het meten van SLI's aan het volgende:

  1. Beschikbaarheid: Dit is binair – is de dienst operationeel of niet? (bijv. uptime gedeeld door totale tijd).
  2. Latentie: De responstijd is de overwogen metriek. Een voorbeeld is de p95-responstijd.
  3. Fouten: Het meten van de frequentie van mislukte verzoeken kan worden gedaan door de verhouding van mislukte tot totale verzoeken te bepalen. ​‍​‌‍​‍‌​‍​‌‍​‍‌
Professionele Tips:
  • Definieer duidelijk de criteria voor wat wordt beschouwd als een “goede” of “geldige” gebeurtenis.
  • Meet, indien mogelijk, vanuit het perspectief van de gebruiker.

Hoe weerspiegelen SLI's de datakwaliteit?

SLI's in datasystemen worden gebruikt om te beoordelen (voornamelijk of data vers, nauwkeurig, compleet en duurzaam is). Ze weerspiegelen de algehele datakwaliteit. SLI's voor datakwaliteit vormen de kern van effectieve monitoring en zorgen ervoor dat datapijplijnen, datasets en andere data-activa geschikt zijn voor analyses, rapportages en AI/ML-workflows.

Houd er rekening mee dat:

Overweeg om herkomst- en validatiecontroles op te nemen ter ondersteuning van SLI's voor datakwaliteit en om meer gedetailleerde inzichten te bieden. 

Hoe vaak moeten SLI's worden gemeten?

Om significante veranderingen in serviceprestaties te detecteren, moeten SLI's frequent genoeg worden gemeten (maar ook zodanig dat ruis wordt verminderd en gevoeligheid niet verloren gaat). De juiste meetfrequentie hangt af van de specifieke service, het gedefinieerde foutenbudget en de mate waarin de gebruikerservaring wordt beïnvloed.

Gangbare intervallen:

  •   Continue of bijna-realtime verzameling
  •   Geaggregeerde vensters van 1 minuut, 5 minuten, of langer.
  •   De redelijke intervallen liggen tussen elke 10 seconden en enkele minuten.

Wat is social proof en hoe is het van toepassing op SaaS?

Social proof is een populaire psychologische tactiek waarbij mensen rekening houden met gebruikersfeedback en -impressies om verschillende aankoopbeslissingen te nemen.
SaaS-bedrijven gebruiken social proof om aan te tonen dat hun producten positieve ervaringen opleveren en voldoen aan de eisen van gebruikers.
Het opbouwen van vertrouwen is essentieel voor SaaS-bedrijven, omdat klanten op zoek zijn naar langetermijnoplossingen in plaats van eenmalige aankopen.

Wat zijn gangbare SLI-metrics?

Overweeg het volgende te observeren:

  1. Golden Signals: Latentie, verkeer/doorvoer, fouten en verzadiging worden vaak gebruikt als SLI's.
  2. Gebruikersgerichte diensten: Gewoonlijk zijn beschikbaarheid, latentie, foutenpercentage en doorvoer voldoende om de prestaties te meten.
  3. Datasystemen: Dergelijke systemen vereisen metrics die versheid, correctheid en duurzaamheid meten.
  4. Strategie: Over het algemeen is het het beste om een handvol belangrijke SLI's voor elke service te kiezen om ruis te verminderen en de overhead te beperken.

 Specifiek voor betalingen, overweeg de volgende: 

  • Autorisatiepercentage betalingen: De verhouding tussen succesvolle autorisaties en het totale aantal pogingen (Correctheid/Succes).
  • Afrekenen Laadtijd: De tijd die nodig is voordat de gehoste checkoutpagina interactief wordt (Latentie).
  • Actualiteit van Webhook-levering: De vertraging tussen een succesvolle betaling en de server van de leverancier die de melding ontvangt (Actualiteit/Latentie).

Conclusie

Service Level Indicatoren (SLI's) vertegenwoordigen belangrijke kwantitatieve indicatoren van kwaliteit en betrouwbaarheid vanuit het perspectief van de gebruiker. Door SLI's, zoals beschikbaarheid, latentie en foutenpercentages, verstandig te kiezen en te meten, kan het team prestatiedrempels afbakenen, ondersteuning plannen en de datakwaliteit handhaven.

Klaar om te beginnen?

We zijn bekend met uw situatie. Laat ons onze 18 jaar ervaring delen en uw wereldwijde dromen realiseren.
Mozaïekafbeelding
nl_NLNederlands