데이터 준비
실무 ML 프로젝트에서 데이터 준비는 전체 시간의 60-80%를 차지합니다. 이 섹션은 원본 데이터를 모델이 학습할 수 있는 형태로 변환하는 전 과정을 다룹니다.| 단계 | 목적 | 핵심 도구 |
|---|---|---|
| EDA | 데이터 이해, 가설 수립 | pandas, seaborn, matplotlib |
| 데이터 정제 | 결측치, 이상치, 중복 처리 | pandas, SimpleImputer |
| 특성 공학 | 새로운 특성 생성 | pandas, PolynomialFeatures |
| 특성 선택 | 유용한 특성만 선별 | RFE, SelectKBest |
| 인코딩/스케일링 | 범주형 변환, 수치형 정규화 | OneHotEncoder, StandardScaler |

