분류 평가 지표
분류 모델의 성능을 단일 지표로 판단하면 오도될 수 있습니다. 문제의 특성에 맞는 지표를 선택하고, 여러 지표를 종합적으로 해석하는 것이 중요합니다.학습 목표
- 혼동 행렬(Confusion Matrix)의 각 요소를 이해합니다.
- Accuracy, Precision, Recall, F1의 차이와 적합한 상황을 파악합니다.
- ROC-AUC와 PR-AUC의 차이를 이해합니다.
- 불균형 데이터에서 적절한 지표를 선택할 수 있습니다.
왜 중요한가
암 진단 모델에서 정확도(Accuracy)가 99%라도, 실제 암 환자를 놓치는 비율이 높다면 의미가 없습니다. 비즈니스 목표에 맞는 지표를 선택해야 올바른 의사결정을 할 수 있습니다.핵심 개념
혼동 행렬 (Confusion Matrix)
| 구분 | 예측: 양성 | 예측: 음성 |
|---|---|---|
| 실제: 양성 | TP (진양성) | FN (위음성) |
| 실제: 음성 | FP (위양성) | TN (진음성) |
핵심 지표 비교
| 지표 | 수식 | 중점 | 적합한 상황 |
|---|---|---|---|
| Accuracy | (TP+TN) / 전체 | 전체 정답률 | 클래스 균형 시 |
| Precision | TP / (TP+FP) | 양성 예측의 정확성 | 거짓 양성 최소화 (스팸 필터) |
| Recall | TP / (TP+FN) | 실제 양성 탐지율 | 거짓 음성 최소화 (암 진단) |
| F1 Score | 2 * P * R / (P+R) | Precision-Recall 균형 | 불균형 데이터 |
ROC-AUC
지표 선택 가이드
| 상황 | 추천 지표 | 이유 |
|---|---|---|
| 클래스 균형 | Accuracy, F1 | 전반적 성능 파악 |
| 클래스 불균형 | F1, PR-AUC | Accuracy가 오도 가능 |
| 거짓 양성 비용 높음 | Precision | 스팸 필터, 사기 경보 |
| 거짓 음성 비용 높음 | Recall | 질병 진단, 결함 탐지 |
| 확률 출력 비교 | ROC-AUC | 모델 전반적 판별력 |
Q: 불균형 데이터에서 왜 Accuracy가 부적절한가요?
Q: 불균형 데이터에서 왜 Accuracy가 부적절한가요?
99:1 비율의 데이터에서 모든 샘플을 다수 클래스로 예측해도 Accuracy는 99%입니다. 실제로는 소수 클래스를 전혀 탐지하지 못하는 무의미한 모델입니다. F1, Recall, PR-AUC를 사용해야 합니다.
Q: ROC-AUC와 PR-AUC의 차이는 무엇인가요?
Q: ROC-AUC와 PR-AUC의 차이는 무엇인가요?
ROC-AUC는 클래스 불균형에도 높은 값을 보일 수 있습니다. PR-AUC는 양성 클래스의 탐지 성능에 집중하므로 불균형 데이터에서 더 엄격한 평가를 제공합니다.
체크리스트
- 혼동 행렬의 TP, FP, FN, TN을 설명할 수 있다
- Precision과 Recall의 트레이드오프를 이해한다
- ROC-AUC 값을 해석할 수 있다
- 비즈니스 목표에 맞는 평가 지표를 선택할 수 있다

