
SRE 관점의 오류 예산(Error Budget) 설정 및 문화 정착 방법1. 오류 예산(Error Budget) 개념 이해Site Reliability Engineering(SRE)에서 가장 핵심적인 개념 중 하나는 오류 예산(Error Budget) 입니다.오류 예산은 "서비스가 얼마만큼 실패할 수 있는지를 정량적으로 정의"하는 수단입니다.즉, 100% 가용성을 요구하는 대신, 서비스 수준 목표(SLO, Service Level Objective)에 따라 일정 수준의 실패를 허용하는 것입니다.오류 예산의 기본 공식오류 예산 = 1 - SLO예를 들어, SLO가 99.9%라면 오류 예산은 0.1%가 됩니다.이는 연간 약 8시간 45분 동안 서비스 장애가 허용된다는 의미입니다.오류 예산이 필요한 이유개발..