Fine-Tuning - 배움 에이아이

이 섹션은 LLM을 도메인에 맞게 조정하는 전체 흐름을 다룹니다. 핵심은 세 가지입니다.

어떤 문제에 파인튜닝이 필요한지 먼저 판단한다
데이터셋 품질을 모델 아키텍처보다 우선한다
오프라인 평가와 온라인 검증을 분리해 운영한다

학습 경로

개요

파인튜닝 파이프라인과 핵심 용어를 빠르게 정리합니다

언제 파인튜닝할까

프롬프트/RAG/파인튜닝의 선택 기준을 의사결정 트리로 설명합니다

데이터셋 설계

Instruction/Preference 데이터 포맷과 품질 기준을 다룹니다

SFT와 PEFT

LoRA/QLoRA/Unsloth + TRL 워크플로우를 실무 기준으로 설명합니다

정렬(Alignment)

DPO/ORPO/RLHF의 차이와 적용 시점을 비교합니다

평가와 배포

벤치마크, 사람 평가, 체크포인트 머지와 서빙 기준을 정리합니다

선수 지식

항목	권장 수준	참고
Python / PyTorch	텐서, DataLoader, 학습 루프 작성 가능	/dl/index
Transformer 기초	Attention, decoder-only 구조 이해	/nlp/transformer/index
RAG 운영 경험	검색 품질/프롬프트 한계 인지	/rag/index

처음이라면 개요 -> 언제 파인튜닝할까 -> 데이터셋 설계 순서로 읽고, 이후 SFT/Alignment로 넘어가는 것이 가장 안정적입니다.

학습 완료 기준

이 섹션의 핵심 개념을 팀 문서로 설명할 수 있습니다.
최소 1개 운영 시나리오를 직접 실행하고 결과를 기록할 수 있습니다.
실패 기준과 롤백 기준을 문서로 정의할 수 있습니다.
다음 섹션으로 넘어가기 전 필수 체크리스트를 완료할 수 있습니다.

실무 적용 체크리스트

현재 운영 중인 모델/프롬프트 버전을 식별할 수 있습니다.
품질·비용·지연 중 우선 KPI를 1순위로 정했습니다.
실험과 운영 환경(dev/stage/prod) 경계를 분리했습니다.
주간 리뷰 주기와 담당자를 지정했습니다.

다음 문서

다음: 파인튜닝 개요

학습 흐름을 이어서 진행합니다.

파인튜닝 개요