법률 및 규정 준수

서비스 수준 지표(SLI)란 무엇인가요?

작성자: Ioana Grigorescu, 콘텐츠 관리자

검토자: George Ploaie, 최고 운영 책임자 (COO)

SLI(서비스 수준 지표)란 무엇인가요?

서비스 수준 지표(SLI)란 무엇인가요?

서비스 수준 지표(SLI)는 서비스의 품질 또는 신뢰성에 대한 정량적인 측정값입니다. SLI는 요청 성공, 지연 시간 또는 데이터 전송 정확성과 같은 측면에 중점을 두어 사용자 경험을 반영합니다. 일반적인 SLI 범주에는 가용성, 지연 시간, 처리량, 오류율, 내구성, 최신성, 정확성이 포함됩니다. SLI를 SLO 및 그에 따른 SLA에 정보를 제공하는 속도계와 같은 원시 측정값으로 생각하십시오.

SLI는 SLO 및 SLA와 어떻게 관련되어 있습니까?

관련이 있지만, SLO, SLI, SLA 개념은 서로 다른 목적을 가지며 계층 구조의 다른 수준에 있습니다.

  •   계층 구조: 이 계층 구조는 엔지니어링 노력이 고객 기대치 및 전반적인 비즈니스 위험 허용 범위와 일치하도록 보장합니다.
  •   목적: SLI 자체는 목표가 아닙니다. SLI는 SLO 목표가 달성되고 있는지 여부를 판단하는 증거를 제공합니다.
  •   연결 고리: 오류 예산은 SLO와 릴리스 속도 사이의 실질적인 연결 고리 역할을 합니다.

개념

정의

SLI

서비스 성능의 원시 측정값.

SLO

해당 측정치(허용 가능한 임계값)의 목표는 특정 시간 범위에 걸쳐 있습니다.

SLA

고객에 대한 계약상의 약속은 종종 그러한 목표를 기반으로 하며 벌칙을 포함합니다.

 

관련 SLI를 어떻게 선택하나요?

귀하에게 적합한 SLI를 선택할 때 명심해야 할 몇 가지 사항은 다음과 같습니다:

  1. 귀하의 사용자 또는 서비스의 가장 중요한 여정이나 기능에 대해 생각해 보세요.
  2. 사용자의 성공 관점을 가장 잘 보여주는 것을 선택하세요. 사용자 만족도에 매우 명확한 영향을 미치는 것을 고르세요.
  3. 세 부서(엔지니어링, 제품, 지원)로부터 의견을 수렴하세요. 이들은 서로 다른 관점을 가질 수 있습니다.
  4. 우선 2~3가지의 핵심 SLI를 결정하고, 제품, 아키텍처 또는 사용자 기대치가 변경됨에 따라 주기적으로 업데이트하세요.

SLI는 성능 임계값을 어떻게 정의합니까?

일반적으로 SLI는 성능 임계값을 정의합니다. 지원되는 매개변수는 다음과 같습니다.

  •   : 제공되는 서비스의 인지된 품질과 일치해야 합니다.
  •   끊임없는 노력이 필요하다는 것을 아는 것이 중요합니다.: 특정 기간 동안 이러한 지표를 사용하여 서비스 수준 계약 준수 여부를 파악할 수 있습니다.
  •   벤치마크: 임계값은 "p95 로그인 지연 시간 200ms 미만"일 수 있으며, 이는 평가에 사용할 정확한 성능 수준을 제공합니다.
  •   알림: 이러한 임계값은 위반 시 SLO 알림의 기준이 됩니다. SLO 미달은 해당 시점에 정확히 기록됩니다.

SLI는 가용성, 지연 시간 및 오류를 어떻게 측정합니까?

SLI를 측정할 때 다음 사항을 염두에 두십시오:

  1. 가용성: 이것은 이분법적인 문제입니다 – 서비스가 운영 중인가 아닌가? (예: 총 가동 시간 중 실제 가동 시간).
  2. 지연 시간: 응답 시간이 고려되는 지표입니다. 예를 들어, p95 응답 시간을 들 수 있습니다.
  3. 오류: 실패한 요청의 빈도는 전체 요청 중 실패한 요청의 비율을 확인하여 측정할 수 있습니다.
전문가 팁:
  • 무엇이 ‘좋은’ 또는 ‘유효한’ 이벤트로 간주되는지에 대한 기준을 명확히 정의하세요.
  • 가능한 경우 사용자 관점에서 측정하십시오.

SLI는 데이터 품질을 어떻게 반영하나요?

데이터 시스템의 SLI는 (주로 데이터의 최신성, 정확성, 완전성, 지속성을) 평가하는 데 사용됩니다. 이는 데이터의 전반적인 품질을 반영합니다. 데이터 품질 SLI는 효과적인 모니터링의 핵심이며, 데이터 파이프라인, 데이터 세트 및 기타 데이터 자산이 분석, 보고 및 AI/ML 워크플로우에 적합하도록 보장합니다.

유의 사항:

데이터 품질 SLI를 지원하고 더 자세한 통찰력을 제공하기 위해 데이터 계보 및 유효성 검사를 포함하는 것을 고려해 보세요. 

SLI는 얼마나 자주 측정해야 하나요?

서비스 성능의 중요한 변화를 감지하려면 SLI가 충분히 자주 완료되어야 합니다(단, 노이즈가 줄어들고 민감도가 손실되지 않는 방식으로). 적절한 측정 빈도는 특정 서비스, 정의된 오류 예산, 그리고 사용자 경험에 미치는 영향의 정도에 따라 달라집니다.

일반적인 간격:

  •   지속적인 또는 준실시간 수집
  •   1분, 5분 또는 그 이상의 집계 기간.
  •   적절한 간격은 10초에서 몇 분 사이입니다.

소셜 프루프란 무엇이며 SaaS에는 어떻게 적용될까요?

소셜 프루프는 사람들이 구매 결정을 내릴 때 다른 사용자의 피드백과 인상을 참고하는 일반적인 심리적 전략입니다.
SaaS 기업은 제품이 긍정적인 경험을 제공하고 사용자 요구 사항을 충족한다는 것을 증명하기 위해 소셜 프루프를 사용합니다.
고객은 일회성 구매보다는 장기적인 솔루션을 찾기 때문에 SaaS 비즈니스에서 신뢰 구축은 매우 중요합니다.

일반적인 SLI 지표는 무엇인가요?

다음 사항을 살펴보십시오:

  1. 골든 시그널: 지연 시간, 트래픽/처리량, 오류, 포화도는 SLI로 자주 사용됩니다.
  2. 사용자 대면 서비스: 일반적으로 가용성, 지연 시간, 오류율 및 처리량은 성능을 측정하기에 충분합니다.
  3. 데이터 시스템: 이러한 시스템은 최신성, 정확성 및 내구성을 측정하는 지표가 필요합니다.
  4. 전략: 일반적으로, 불필요한 요소를 줄이고 오버헤드를 제한하기 위해 각 서비스에 대해 중요한 SLI 몇 가지를 선택하는 것이 가장 좋습니다.

 특히 결제에 있어서는 다음 사항들을 고려하십시오: 

  • 결제 승인율: 총 시도 대비 성공적인 승인의 비율 (정확성/성공).
  • 결제 로딩 시간: 호스팅된 결제 페이지가 상호작용 가능해지기까지 걸리는 시간 (지연 시간).
  • 웹훅 전달 최신성: 성공적인 결제와 판매자 서버가 알림을 수신하는 시점 사이의 지연 (최신성/지연 시간).

결론

서비스 수준 지표(SLI)는 사용자 관점에서 품질과 신뢰성을 나타내는 핵심적인 정량적 지표입니다. 팀은 가용성, 지연 시간 및 오류율 수준과 같은 SLI를 현명하게 선택하고 측정함으로써 성능 임계값을 설정하고 지원을 계획하며 데이터 품질을 유지할 수 있습니다.

시작할 준비가 되셨나요?

저희가 도와드리겠습니다. 18년의 경험을 바탕으로 여러분의 글로벌 진출의 꿈을 현실로 만들어 드리겠습니다.
Mosaic Image
ko_KR한국어