파인튜닝 개요 - 배움 에이아이

파인튜닝은 “모델을 더 똑똑하게” 만드는 작업이 아닙니다. 정확히는 “우리 업무에서 반복되는 실패 패턴을 줄이는 작업”입니다.

파인튜닝이 해결하는 문제

문제 정의

성능 목표를 수치로 정의합니다. 예: 정확도 +8%, JSON 형식 오류율 5% -> 1%.

데이터 설계

Instruction/Preference 데이터를 만들고 분할합니다. 학습셋, 검증셋, 홀드아웃셋을 명확히 분리합니다.

학습 전략 선택

SFT만으로 충분한지, DPO/ORPO까지 필요한지 결정합니다.

학습 실행

베이스 모델과 하이퍼파라미터를 고정하고 재현 가능한 실험 로그를 남깁니다.

평가/배포

오프라인 벤치마크 + 사람 평가 후, 제한 트래픽으로 배포합니다.

데이터셋이 문제 정의와 맞지 않음

모델이 틀린 이유를 데이터가 설명하지 못하면 성능이 올라가지 않습니다. 먼저 실패 케이스를 유형화하고, 그 유형을 데이터에 반영합니다.

평가셋 오염

학습셋과 평가셋이 유사하거나 중복되면 지표가 과대평가됩니다. 해시/유사도 기반 중복 제거를 반드시 수행합니다.

한 번에 너무 많은 변경

모델, 데이터, 프롬프트, 디코딩 파라미터를 동시에 바꾸면 원인 분석이 불가능합니다. 실험은 한 변수만 바꾸는 방식으로 진행합니다.

파인튜닝 성능의 대부분은 모델보다 데이터 설계에서 결정됩니다. SFT 이전에 데이터 품질 기준부터 고정합니다.

학습 흐름을 이어서 진행합니다.