대응 단계
커뮤니케이션 규칙
- 15분 내 1차 공유(상황/영향/다음 업데이트 시점)
- 이해관계자별 채널 분리(내부, 고객, 경영진)
- 추정이 아닌 확인된 사실 중심으로 공유
사후 문서 필수 항목
- 타임라인(탐지-완화-복구)
- 근본 원인
- 놓친 신호와 경보 개선안
- 재발 방지 작업 담당자/기한
실무 적용 체크리스트
- 이 문서의 규칙을 실제 서비스 플로우에 매핑했습니다.
- 측정 지표와 실패 임계값을 숫자로 정의했습니다.
- 변경 전/후를 비교할 기준 데이터셋 또는 로그를 준비했습니다.
- 팀 내 공유 문서(런북/가이드)에 반영했습니다.
자주 나는 실수
- 기준 지표 없이 개선을 선언합니다.
- 한 번에 여러 변수를 바꿔 원인 추적이 불가능해집니다.
- 롤백 조건 없이 배포해 장애 복구가 늦어집니다.
다음 문서
다음: 거버넌스와 보안
학습 흐름을 이어서 진행합니다.

