SFT와 PEFT

SFT는 모델의 기본 행동을 도메인에 맞게 재조정하는 단계입니다. 대부분의 팀은 풀 파인튜닝보다 PEFT(LoRA/QLoRA)부터 시작합니다.

학습 경로

LoRA / QLoRA

메모리 절감 방식과 적용 기준을 비교합니다

Unsloth + TRL 워크플로우

실무에서 자주 쓰는 학습 루틴과 체크포인트 관리를 설명합니다

SFT 기본 원칙

권장 실험 순서

학습 완료 기준

실무 적용 체크리스트

다음 문서

다음: LoRA와 QLoRA

학습 흐름을 이어서 진행합니다.

학습 경로

LoRA / QLoRA

Unsloth + TRL 워크플로우

SFT 기본 원칙

권장 실험 순서

학습 완료 기준

실무 적용 체크리스트

다음 문서

다음: LoRA와 QLoRA

​학습 경로

LoRA / QLoRA

Unsloth + TRL 워크플로우

​SFT 기본 원칙

​권장 실험 순서

​학습 완료 기준

​실무 적용 체크리스트

​다음 문서

다음: LoRA와 QLoRA

학습 경로

SFT 기본 원칙

권장 실험 순서

학습 완료 기준

실무 적용 체크리스트

다음 문서