핵심 개념
- 비지도/준지도 이상치 탐지
- 오탐(False Positive) 비용 관리
- 점수 기반 임계값 설정
자주 보는 평가 지표
ROC-AUCPR-AUCRecall@K
알고리즘 목록
참고
언제 쓰나
정상 패턴 대비 드문 이상 샘플을 빠르게 탐지해야 할 때 사용합니다. 작은 실험셋으로 빠르게 기준 성능을 확인한 뒤, 필요하면 더 복잡한 모델로 확장합니다.실무 적용 체크리스트
- 데이터 누수 가능성을 먼저 점검했습니다.
- 학습/검증/테스트 분할 기준을 고정했습니다.
- 핵심 지표(예: F1, RMSE, AUC)를 명시했습니다.
- 베이스라인 대비 개선폭과 비용 변화를 함께 기록했습니다.
자주 나는 실수
- 데이터 분할 전에 전처리를 수행해 데이터 누수가 발생합니다.
- 단일 지표만 보고 모델을 선택해 운영 성능이 불안정해집니다.
- 하이퍼파라미터를 과도하게 조정해 검증셋 과적합이 생깁니다.
다음 문서
다음: Isolation Forest
학습 흐름을 이어서 진행합니다.

