Legal e Conformidade

O que é um Indicador de Nível de Serviço (SLI)?

Autor: Ioana Grigorescu, Gerente de Conteúdo

Revisado por: George Ploaie, Diretor de Operações (COO)

O que é um SLI (Indicador de Nível de Serviço)

O que é um Indicador de Nível de Serviço (SLI)?

Um Indicador de Nível de Serviço (SLI) é uma medida quantitativa da qualidade ou confiabilidade de um serviço. Os SLIs refletem a experiência do usuário, focando em aspectos como sucesso de requisição, latência ou correção na entrega de dados. As categorias comuns de SLI incluem disponibilidade, latência, vazão, taxa de erro, durabilidade, atualidade e correção. Pense em um SLI como uma medição bruta, como um velocímetro, que informa os SLOs e, consequentemente, os SLAs.

Como os SLIs se relacionam com os SLOs e SLAs?

Embora relacionados, os conceitos de SLOs, SLIs e SLAs servem a propósitos diferentes e estão em diferentes níveis de hierarquia.

  •   Hierarquia: Esta hierarquia garante que os esforços de engenharia se alinhem tanto com as expectativas do cliente quanto com a tolerância geral ao risco do negócio.
  •   Propósito: SLIs por si só não são metas; eles fornecem a evidência para determinar se as metas de SLOs estão sendo atingidas.
  •   Ponte: Orçamentos de erro fornecem uma ponte prática entre SLOs e a velocidade de lançamento.

Conceito

Definição

SLI

As medições brutas do desempenho do serviço.

SLO

As metas para essas medições (limiares aceitáveis) são definidas em uma janela de tempo específica.

SLA

Os compromissos contratuais com os clientes são frequentemente baseados nessas metas e incluem penalidades.

 

Como você escolhe SLIs relevantes?

Aqui estão alguns pontos a ter em mente ao selecionar SLIs relevantes para você:

  1. Pense na jornada ou capacidade mais importante do seu usuário ou serviço.
  2. Escolha aqueles que melhor mostram a perspectiva de sucesso do usuário. Selecione os que têm um impacto muito claro na satisfação do usuário.
  3. Obtenha feedback dos três departamentos: engenharia, produto e suporte, que provavelmente terão pontos de vista diferentes.
  4. Determine 2-3 SLIs essenciais para começar; atualize-os periodicamente conforme seu produto, arquitetura ou as expectativas dos usuários mudam.

Como os SLIs definem os limites de desempenho?

Geralmente, os SLIs definem os limites de desempenho. Os parâmetros de apoio são:

  •   Valores: Devem se alinhar com a qualidade percebida do serviço prestado.
  •   com o GDPR: Ao longo de um período especificado, estas métricas podem ser usadas para determinar a conformidade com o contrato de nível de serviço.
  •   Benchmark: Um limite pode ser “latência de login p95 abaixo de 200 ms”, o que fornece um nível exato de desempenho para avaliar.
  •   Alertas: Esses limites são a base dos alertas de SLO quando são violados. Uma falha de SLO é registrada especificamente naquele momento.

Como os SLIs medem a disponibilidade, latência e erros?

Ao pensar em medir SLIs, tenha em mente o seguinte:

  1. Disponibilidade: É uma questão binária – o serviço está operacional ou não? (ex: tempo de atividade dividido pelo tempo total).
  2. Latência: O tempo de resposta é a métrica considerada. Um exemplo pode ser o tempo de resposta p95.
  3. Erros: A medição da frequência de requisições falhas pode ser feita determinando a proporção de requisições falhas em relação ao total de requisições.​‍​‌‍​‍‌​‍​‌‍​‍‌
Dicas Profissionais:
  • Defina claramente os critérios para o que é considerado um “bom” ou “válido” evento.
  • Meça a partir da perspectiva do usuário sempre que possível.

Como os SLIs refletem a qualidade dos dados?

SLIs em sistemas de dados são usados para avaliar (se os dados estão atualizados, precisos, completos e duradouros, principalmente). Eles refletem a qualidade geral dos dados. SLIs de qualidade de dados estão no cerne de um monitoramento eficaz, garantindo que pipelines de dados, conjuntos de dados e outros ativos de dados sejam adequados para análises, relatórios e fluxos de trabalho de IA/ML.

Tenha em mente:

Considere incluir linhagem e verificações de validação para apoiar os SLIs de qualidade de dados e fornecer insights mais detalhados. 

Com que frequência os SLIs devem ser medidos?

Para detectar mudanças significativas no desempenho do serviço, os SLIs devem ser preenchidos com frequência suficiente (mas também de forma que o ruído seja reduzido e a sensibilidade não seja perdida). A frequência de medição adequada depende do serviço específico, do orçamento de erro que foi definido e do grau em que a experiência do usuário é afetada.

Intervalos Comuns:

  •   Coleta contínua ou quase em tempo real
  •   Janelas agregadas de 1 minuto, 5 minutos ou mais.
  •   Os intervalos razoáveis são entre cada 10 segundos e vários minutos.

O que é prova social e como ela se aplica ao SaaS?

A prova social é uma tática psicológica popular em que as pessoas consideram o feedback e as impressões do usuário para tomar diferentes decisões de compra.
As empresas SaaS usam a prova social para demonstrar que seus produtos oferecem experiências positivas e respondem aos requisitos do usuário.
Construir confiança é fundamental para o negócio SaaS, pois os clientes buscam soluções de longo prazo em vez de compras únicas.

Quais são as métricas comuns de SLI?

Considere observar o seguinte:

  1. Sinais Dourados: Latência, tráfego/taxa de transferência, erros e saturação são frequentemente usados como SLIs.
  2. Serviços Voltados para o Usuário: Normalmente, disponibilidade, latência, taxa de erro e taxa de transferência são suficientes para avaliar o desempenho.
  3. Sistemas de Dados: Tais sistemas exigem métricas que medem a atualidade, correção e durabilidade.
  4. Estratégia: Geralmente, é melhor escolher alguns SLIs importantes para cada serviço para reduzir o ruído e limitar a sobrecarga.

 Para pagamentos especificamente, considere os seguintes: 

  • Taxa de Autorização de Pagamento: A proporção de autorizações bem-sucedidas em relação ao total de tentativas (Precisão/Sucesso).
  • Finalizar Compra Tempo de Carregamento: O tempo que a página de checkout hospedada leva para se tornar interativa (Latência).
  • Atualidade da Entrega de Webhook: O atraso entre um pagamento bem-sucedido e o servidor do fornecedor receber a notificação (Atualidade/Latência).

Conclusão

Indicadores de Nível de Serviço (SLIs) representam indicadores quantitativos chave de qualidade e confiabilidade da perspectiva do usuário. Ao escolher e medir sabiamente os SLIs, como níveis de disponibilidade, latência e taxa de erro, a equipe pode delinear limites de desempenho, planejar suporte e manter a qualidade dos dados.

Pronto para começar?

Nós já estivemos onde você está. Compartilhe conosco os seus sonhos globais e deixe nossa experiência de 18 anos torná-los realidade.
Imagem em Mosaico
pt_BRPortuguês do Brasil