- 어떤 문제에 파인튜닝이 필요한지 먼저 판단한다
- 데이터셋 품질을 모델 아키텍처보다 우선한다
- 오프라인 평가와 온라인 검증을 분리해 운영한다
학습 경로
개요
파인튜닝 파이프라인과 핵심 용어를 빠르게 정리합니다
언제 파인튜닝할까
프롬프트/RAG/파인튜닝의 선택 기준을 의사결정 트리로 설명합니다
데이터셋 설계
Instruction/Preference 데이터 포맷과 품질 기준을 다룹니다
SFT와 PEFT
LoRA/QLoRA/Unsloth + TRL 워크플로우를 실무 기준으로 설명합니다
정렬(Alignment)
DPO/ORPO/RLHF의 차이와 적용 시점을 비교합니다
평가와 배포
벤치마크, 사람 평가, 체크포인트 머지와 서빙 기준을 정리합니다
선수 지식
| 항목 | 권장 수준 | 참고 |
|---|---|---|
| Python / PyTorch | 텐서, DataLoader, 학습 루프 작성 가능 | /dl/index |
| Transformer 기초 | Attention, decoder-only 구조 이해 | /nlp/transformer/index |
| RAG 운영 경험 | 검색 품질/프롬프트 한계 인지 | /rag/index |
학습 완료 기준
- 이 섹션의 핵심 개념을 팀 문서로 설명할 수 있습니다.
- 최소 1개 운영 시나리오를 직접 실행하고 결과를 기록할 수 있습니다.
- 실패 기준과 롤백 기준을 문서로 정의할 수 있습니다.
- 다음 섹션으로 넘어가기 전 필수 체크리스트를 완료할 수 있습니다.
실무 적용 체크리스트
- 현재 운영 중인 모델/프롬프트 버전을 식별할 수 있습니다.
- 품질·비용·지연 중 우선 KPI를 1순위로 정했습니다.
- 실험과 운영 환경(dev/stage/prod) 경계를 분리했습니다.
- 주간 리뷰 주기와 담당자를 지정했습니다.
다음 문서
다음: 파인튜닝 개요
학습 흐름을 이어서 진행합니다.

