체크포인트 머지와 서빙
학습이 끝나면 “어떤 체크포인트를 배포할지”를 결정해야 합니다. 결정 기준과 롤백 절차가 없으면 운영 리스크가 커집니다.체크포인트 선정 기준
| 기준 | 설명 |
|---|---|
| 오프라인 지표 | holdout 성능이 베이스라인 대비 개선 |
| 안전성 | 정책 위반률이 허용 범위 이내 |
| 일관성 | 동일 입력에 대한 출력 변동이 작음 |
| 비용 | 추론 지연/비용이 운영 기준 충족 |
배포 전략
롤백 조건 예시
- 정책 위반률이 기준치 초과
- 핵심 태스크 실패율 급증
- p95 지연시간이 SLA 초과
- 사용자 불만/클레임 급증
운영 팁
- 모델 카드에 데이터 버전/평가 결과를 함께 기록합니다
- 체크포인트명은 의미 있는 규칙으로 통일합니다
- 이전 안정 버전을 항상 즉시 복구 가능 상태로 유지합니다

