선택 프레임
| 조건 | 우선 전략 | 보조 전략 |
|---|---|---|
| 수치형 + 이상치 많음 | 중앙값 대체 | 그룹 중앙값 대체 |
| 범주형 + 클래스 불균형 | 최빈값 대체 | Unknown 신설 |
| 시계열 + 연속 신호 | ffill/bfill | 선형 보간 |
| 모델이 결측 자체 처리 가능(XGBoost 등) | 원본 결측 유지 | 결측 플래그 추가 |
컬럼별 대체 예시
그룹별 대체
검증 포인트
- 대체 전/후 평균, 분산, 분위수 변화를 비교합니다.
- 모델 성능뿐 아니라 캘리브레이션/에러 분포도 함께 확인합니다.
- 운영 로그에서 결측률이 급변하는지 모니터링합니다.

