Aspetti legali e conformità
Cos'è un Indicatore del Livello di Servizio (SLI)?
Cos'è un Indicatore del Livello di Servizio (SLI)?
Un Indicatore del Livello di Servizio (SLI) è una misura quantitativa della qualità o affidabilità di un servizio. Gli SLI riflettono l'esperienza utente, concentrandosi su aspetti come il successo delle richieste, la latenza o la correttezza della consegna dei dati. Le categorie comuni di SLI includono disponibilità, latenza, throughput, tasso di errore, durabilità, freschezza e correttezza. Pensa a un SLI come a una misurazione grezza, come un tachimetro, che informa gli SLO e, successivamente, gli SLA.
Come si relazionano gli SLI agli SLO e agli SLA?
Sebbene correlati, i concetti di SLO, SLI e SLA servono a scopi diversi e si trovano a livelli gerarchici diversi.
- Gerarchia: Questa gerarchia garantisce che gli sforzi di ingegneria siano allineati sia con le aspettative del cliente che con la tolleranza complessiva al rischio aziendale.
- Scopo: Gli SLI di per sé non sono obiettivi; forniscono le prove per determinare se gli obiettivi SLO vengono raggiunti.
- Ponte: I budget di errore forniscono un ponte pratico tra gli SLO e la velocità di rilascio.
|
Concetto |
Definizione |
|
SLI |
Le misurazioni grezze delle prestazioni del servizio. |
|
Gli obiettivi per quelle misurazioni (soglie accettabili) sono definiti su una finestra temporale specifica. |
|
|
SLA |
Gli impegni contrattuali verso i clienti sono spesso basati su quegli obiettivi e includono penali. |
Come si scelgono gli SLI rilevanti?
Ecco alcuni punti da tenere a mente nella selezione degli SLI pertinenti al tuo caso:
- Pensa al percorso o alla funzionalità più importanti del tuo utente o servizio.
- Scegli quelli che meglio riflettono la prospettiva di successo dell'utente. Seleziona quelli con un impatto molto chiaro sulla soddisfazione dell'utente.
- Ottieni input dai tre dipartimenti: ingegneria, prodotto e supporto, che probabilmente avranno punti di vista diversi.
- Determinare 2-3 SLI essenziali per iniziare; aggiornarli periodicamente man mano che il prodotto, l'architettura o le aspettative degli utenti cambiano.
Come definiscono gli SLI le soglie di performance?
Di solito, gli SLI definiscono le soglie di prestazione. I parametri di supporto sono:
- Valori: Dovrebbero allinearsi alla qualità percepita del servizio fornito.
- Compliance: In un periodo specificato, queste metriche possono essere utilizzate per calcolare la conformità agli accordi sul livello di servizio.
- Benchmark: Una soglia potrebbe essere “latenza di login p95 inferiore a 200 ms,” il che fornisce un livello esatto di prestazioni su cui basare la valutazione.
- Avvisi: Queste soglie sono la base degli avvisi SLO quando vengono violate. Una violazione dello SLO viene registrata specificamente in quel preciso momento.
Come misurano gli SLI la disponibilità, la latenza e gli errori?
Quando si pensa a misurare gli SLI, si tenga presente quanto segue:
- Disponibilità: È una questione binaria – il servizio è operativo o meno? (ad es., tempo di attività diviso per il tempo totale).
- Latenza: Il tempo di risposta è la metrica considerata. Un esempio può essere il tempo di risposta p95.
- Errori: La misurazione della frequenza delle richieste fallite potrebbe essere fatta determinando il rapporto tra richieste fallite e richieste totali.
- Definire chiaramente i criteri per ciò che è considerato un evento “buono” o “valido”.
- Misura dalla prospettiva dell'utente quando possibile.
Come gli SLI riflettono la qualità dei dati?
Gli SLI nei sistemi di dati sono utilizzati per valutare (principalmente se i dati sono recenti, accurati, completi e duraturi). Essi riflettono la qualità complessiva dei dati. Gli SLI per la qualità dei dati sono al centro di un monitoraggio efficace, garantendo che le pipeline di dati, i set di dati e altre risorse di dati siano adatti per analisi, reportistica e flussi di lavoro AI/ML.
Valuta di includere controlli di provenienza e di validazione per supportare gli SLI sulla qualità dei dati e fornire insight più dettagliati.
Con quale frequenza dovrebbero essere misurati gli SLI?
Per rilevare cambiamenti significativi nelle prestazioni del servizio, gli SLI dovrebbero essere misurati con sufficiente frequenza (ma anche in modo tale da ridurre il rumore e non perdere la sensibilità). La frequenza di misurazione adeguata dipende dal servizio specifico, dal budget di errore che è stato definito e dal grado in cui l'esperienza dell'utente è influenzata.
Intervalli Comuni:
- Raccolta continua o quasi in tempo reale
- Finestre aggregate di 1 minuto, 5 minuti o più.
- Gli intervalli ragionevoli sono tra ogni 10 secondi e diversi minuti.
Cos'è la riprova sociale e come si applica al SaaS?
La riprova sociale è una popolare tattica psicologica in cui le persone prendono in considerazione il feedback e le impressioni degli utenti per prendere decisioni di acquisto diverse.
Le aziende SaaS utilizzano la riprova sociale per dimostrare che i loro prodotti offrono esperienze positive e rispondono alle esigenze degli utenti.
Costruire la fiducia è fondamentale per le aziende SaaS, poiché i clienti cercano soluzioni a lungo termine piuttosto che acquisti una tantum.
Quali sono le metriche SLI comuni?
Considera di osservare quanto segue:
- Golden Signals: Latenza, traffico/throughput, errori e saturazione sono frequentemente usati come SLI.
- Servizi rivolti all'utente: Di solito, disponibilità, latenza, tasso di errore e throughput sono sufficienti per misurare le prestazioni.
- Sistemi di dati: Tali sistemi richiedono metriche che misurino freschezza, correttezza e durabilità.
- Strategia: Generalmente, è meglio scegliere una manciata di SLI importanti per ogni servizio per ridurre il rumore e limitare il sovraccarico.
Per i pagamenti in particolare, considera i seguenti:
- Tasso di Autorizzazione dei Pagamenti: Il rapporto tra autorizzazioni riuscite e tentativi totali (Correttezza/Successo).
- Pagamento Tempo di Caricamento: Il tempo necessario affinché la pagina di checkout ospitata diventi interattiva (Latenza).
- Freschezza della Consegna Webhook: Il ritardo tra un pagamento andato a buon fine e la ricezione della notifica da parte del server del venditore (Tempestività/Latenza).
Conclusione
Gli Indicatori del Livello di Servizio (SLI) rappresentano indicatori quantitativi chiave di qualità e affidabilità dal punto di vista dell'utente. Scegliendo e misurando saggiamente gli SLI, come disponibilità, latenza e livelli di tasso di errore, il team può delineare le soglie di prestazione, pianificare il supporto e mantenere la qualità dei dati.