Skip to main content

모델 평가와 검증

모델을 학습하는 것만큼 중요한 것이 올바른 평가입니다. 잘못된 평가 전략은 실제로는 성능이 낮은 모델을 선택하거나, 과적합된 모델을 배포하는 결과를 초래합니다.
주제핵심 질문
데이터 분할학습/검증/테스트를 어떻게 나누는가?
교차검증분할 방식에 따른 편향을 어떻게 줄이는가?
분류 평가 지표Accuracy, F1, ROC-AUC 중 무엇을 쓸 것인가?
회귀 평가 지표MSE, R-squared 중 무엇이 적합한가?
과적합/과소적합모델 복잡도를 어떻게 조절하는가?
하이퍼파라미터 튜닝최적의 설정을 어떻게 찾는가?
학습 곡선모델의 문제를 어떻게 진단하는가?
평가 지표는 비즈니스 목표와 일치해야 합니다. 의료 진단에서는 재현율(Recall)이, 스팸 필터에서는 정밀도(Precision)가 더 중요할 수 있습니다.