Skip to main content

ML 파이프라인

ML 파이프라인은 전처리, 모델 학습, 예측을 하나의 재현 가능한 워크플로우로 묶어주는 구조입니다. 데이터 누수를 방지하고, 코드 재사용성을 높이며, 실험을 체계적으로 관리할 수 있습니다.
주제핵심 도구목적
Scikit-learn PipelinePipeline, ColumnTransformer전처리 + 모델 통합, 데이터 누수 방지
실험 관리MLflow하이퍼파라미터, 메트릭, 모델 버전 기록
모델 저장/배포joblib, ONNX학습된 모델의 직렬화, 포맷 변환
파이프라인을 사용하면 fittransform의 순서를 자동으로 관리해주므로, 데이터 누수를 원천적으로 방지할 수 있습니다.