Skip to main content

파인튜닝 개요

파인튜닝은 “모델을 더 똑똑하게” 만드는 작업이 아닙니다. 정확히는 “우리 업무에서 반복되는 실패 패턴을 줄이는 작업”입니다.

파인튜닝이 해결하는 문제

  • 출력 형식이 자주 깨진다
  • 도메인 용어 이해가 약하다
  • 특정 작업에서 일관성이 부족하다
  • 긴 지시를 따라도 핵심 제약을 놓친다

전체 파이프라인

1

문제 정의

성능 목표를 수치로 정의합니다. 예: 정확도 +8%, JSON 형식 오류율 5% -> 1%.
2

데이터 설계

Instruction/Preference 데이터를 만들고 분할합니다. 학습셋, 검증셋, 홀드아웃셋을 명확히 분리합니다.
3

학습 전략 선택

SFT만으로 충분한지, DPO/ORPO까지 필요한지 결정합니다.
4

학습 실행

베이스 모델과 하이퍼파라미터를 고정하고 재현 가능한 실험 로그를 남깁니다.
5

평가/배포

오프라인 벤치마크 + 사람 평가 후, 제한 트래픽으로 배포합니다.

실무 산출물 체크리스트

단계필수 산출물
문제 정의KPI 문서, 성공/실패 예시 20개 이상
데이터 설계데이터 스키마, 라벨링 가이드, 품질 리포트
학습실험 로그(파라미터/시드/버전), 체크포인트
평가자동 지표 + 사람 평가 결과, 에러 분류표
배포롤백 기준, 모니터링 대시보드, 릴리즈 노트

가장 흔한 실패 원인

모델이 틀린 이유를 데이터가 설명하지 못하면 성능이 올라가지 않습니다. 먼저 실패 케이스를 유형화하고, 그 유형을 데이터에 반영하세요.
학습셋과 평가셋이 유사하거나 중복되면 지표가 과대평가됩니다. 해시/유사도 기반 중복 제거를 반드시 수행하세요.
모델, 데이터, 프롬프트, 디코딩 파라미터를 동시에 바꾸면 원인 분석이 불가능합니다. 실험은 한 변수만 바꾸는 방식으로 진행하세요.
파인튜닝 성능의 대부분은 모델보다 데이터 설계에서 결정됩니다. SFT 이전에 데이터 품질 기준부터 고정하세요.