Legal y cumplimiento
¿Qué es un Indicador de Nivel de Servicio (SLI)?
¿Qué es un Indicador de Nivel de Servicio (SLI)?
Un Indicador de Nivel de Servicio (SLI) es una medida cuantitativa de la calidad o fiabilidad de un servicio. Los SLI reflejan la experiencia del usuario, centrándose en aspectos como el éxito de las solicitudes, la latencia o la corrección en la entrega de datos. Las categorías comunes de SLI incluyen disponibilidad, latencia, rendimiento (throughput), tasa de errores, durabilidad, frescura y corrección. Piense en un SLI como una medición bruta, como un velocímetro, que informa a los SLO y, posteriormente, a los SLA.
¿Cómo se relacionan los SLI con los SLO y los SLA?
Aunque relacionados, los conceptos de SLOs, SLIs y SLAs sirven a propósitos diferentes y se encuentran en distintos niveles de jerarquía.
- Jerarquía: Esta jerarquía asegura que los esfuerzos de ingeniería se alineen tanto con las expectativas del cliente como con la tolerancia general al riesgo del negocio.
- Propósito: Los SLIs por sí mismos no son objetivos; proporcionan la evidencia para determinar si los objetivos de SLO se están cumpliendo.
- Puente: Los presupuestos de error proporcionan un puente práctico entre los SLOs y la velocidad de lanzamiento.
|
Concepto |
Definición |
|
SLI |
Las mediciones en bruto del rendimiento del servicio. |
|
Los objetivos para esas mediciones (umbrales aceptables) se establecen para una ventana de tiempo específica. |
|
|
SLA |
Los compromisos contractuales con los clientes a menudo se basan en esos objetivos e incluyen penalizaciones. |
¿Cómo se eligen los SLIs relevantes?
Aquí hay algunos puntos a tener en cuenta al seleccionar los SLI relevantes para usted:
- Piense en el recorrido o la capacidad más importante de su usuario o servicio.
- Elija los que mejor muestren la perspectiva de éxito del usuario. Seleccione aquellos con un impacto muy claro en la satisfacción del usuario.
- Recopile aportaciones de los tres departamentos: ingeniería, producto y soporte, que probablemente tendrán perspectivas diferentes.
- Determine 2 o 3 SLI esenciales para empezar; actualícelos periódicamente a medida que cambien su producto, arquitectura o las expectativas de los usuarios.
¿Cómo definen los SLI los umbrales de rendimiento?
Normalmente, los SLI definen umbrales de rendimiento. Los parámetros de soporte son:
- Valores: Deben alinearse con la calidad percibida del servicio prestado.
- Cumplimiento: Durante un período especificado, estas métricas pueden utilizarse para determinar el cumplimiento del acuerdo de nivel de servicio.
- Referencia: Un umbral podría ser “p95 login latency under 200 ms,” lo que proporciona un nivel de rendimiento exacto contra el cual evaluar.
- Alertas: Estos umbrales son la base de las alertas SLO cuando se incumplen. Un fallo de SLO se registra específicamente en ese momento.
¿Cómo miden los SLI la disponibilidad, la latencia y los errores?
Al pensar en medir los SLI, tenga en cuenta lo siguiente:
- Disponibilidad: Esto es algo binario: ¿el servicio está operativo o no? (p. ej., tiempo de actividad dividido por el tiempo total).
- Latencia: El tiempo de respuesta es la métrica considerada. Un ejemplo puede ser el tiempo de respuesta p95.
- Errores: La medición de la frecuencia de las solicitudes fallidas podría hacerse determinando la proporción de solicitudes fallidas respecto al total.
- Defina claramente los criterios para lo que se considera un evento “bueno” o “válido”.
- Mida desde la perspectiva del usuario cuando sea posible.
¿Cómo reflejan los SLI la calidad de los datos?
Los SLI en los sistemas de datos se utilizan para evaluar (principalmente si los datos son actuales, precisos, completos y duraderos). Reflejan la calidad general de los datos. Los SLI de calidad de datos son la base de una monitorización eficaz, asegurando que los pipelines de datos, los conjuntos de datos y otros activos de datos sean adecuados para análisis, informes y flujos de trabajo de IA/ML.
Considere incluir controles de linaje y validación para respaldar los SLI de calidad de datos y proporcionar información más detallada.
¿Con qué frecuencia se deben medir los SLI?
Para detectar cambios significativos en el rendimiento del servicio, los SLI deben completarse con la frecuencia suficiente (pero también de una manera que el ruido se reduzca y la sensibilidad no se pierda). La frecuencia de medición adecuada depende del servicio específico, el presupuesto de errores que se haya definido y el grado en que la experiencia del usuario se ve afectada.
Intervalos comunes:
- Recopilación continua o casi en tiempo real
- Ventanas agregadas de 1 minuto, 5 minutos o más.
- Los intervalos razonables están entre cada 10 segundos y varios minutos.
¿Qué es la prueba social y cómo se aplica al SaaS?
La prueba social es una táctica psicológica popular donde las personas consideran los comentarios e impresiones de los usuarios para tomar diferentes decisiones de compra.
Las empresas SaaS utilizan la prueba social para demostrar que sus productos ofrecen experiencias positivas y responden a las necesidades de los usuarios.
Generar confianza es clave para los negocios SaaS, ya que los clientes buscan soluciones a largo plazo en lugar de compras únicas.
¿Cuáles son las métricas SLI comunes?
Considere observar lo siguiente:
- Señales Doradas: Latencia, tráfico/rendimiento, errores y saturación se utilizan frecuentemente como SLIs.
- Servicios Orientados al Usuario: Usualmente, la disponibilidad, latencia, tasa de errores y rendimiento son suficientes para medir el rendimiento.
- Sistemas de Datos: Dichos sistemas requieren métricas que midan la frescura, la exactitud y la durabilidad.
- Estrategia: Generalmente, es mejor elegir un puñado de SLI importantes para cada servicio para reducir el ruido y limitar la sobrecarga.
Para los pagos específicamente, considere los siguientes:
- Tasa de Autorización de Pagos: La relación entre autorizaciones exitosas y el total de intentos (Corrección/Éxito).
- Pago Tiempo de Carga: El tiempo que tarda la página de pago alojada en volverse interactiva (Latencia).
- Frescura de Entrega de Webhook: El retraso entre un pago exitoso y la recepción de la notificación por parte del servidor del proveedor (Actualización/Latencia).
Conclusión
Los Indicadores de Nivel de Servicio (SLIs) representan indicadores cuantitativos clave de calidad y fiabilidad desde la perspectiva del usuario. Al elegir y medir sabiamente los SLIs, como la disponibilidad, la latencia y los niveles de tasa de error, el equipo puede delimitar umbrales de rendimiento, planificar el soporte y mantener la calidad de los datos.