Skip to main content

인시던트 대응

인시던트 대응의 목표는 “원인 분석”보다 먼저 “영향 최소화”입니다. 복구와 커뮤니케이션을 동시에 진행하세요.

대응 단계

1

탐지

알림 또는 사용자 신고로 이상 징후를 확인합니다.
2

분류

영향 범위(사용자, 기능, 지역, 테넌트)를 즉시 파악합니다.
3

완화

모델 롤백, 기능 제한, 트래픽 우회 등 임시 완화 조치를 실행합니다.
4

복구

서비스 정상화 후 지표 안정 여부를 확인합니다.
5

사후 회고

원인, 대응 타임라인, 재발 방지 액션을 기록합니다.

커뮤니케이션 규칙

  • 15분 내 1차 공유(상황/영향/다음 업데이트 시점)
  • 이해관계자별 채널 분리(내부, 고객, 경영진)
  • 추정이 아닌 확인된 사실 중심으로 공유

사후 문서 필수 항목

  • 타임라인(탐지-완화-복구)
  • 근본 원인
  • 놓친 신호와 경보 개선안
  • 재발 방지 작업 담당자/기한
사후 회고는 비난 문서가 아니라 시스템 개선 문서입니다. 개인 실수보다 절차/도구/검증 공백을 먼저 보세요.