Skip to main content
이 섹션은 LLM을 도메인에 맞게 조정하는 전체 흐름을 다룹니다. 핵심은 세 가지입니다.
  • 어떤 문제에 파인튜닝이 필요한지 먼저 판단한다
  • 데이터셋 품질을 모델 아키텍처보다 우선한다
  • 오프라인 평가와 온라인 검증을 분리해 운영한다

학습 경로

개요

파인튜닝 파이프라인과 핵심 용어를 빠르게 정리합니다

언제 파인튜닝할까

프롬프트/RAG/파인튜닝의 선택 기준을 의사결정 트리로 설명합니다

데이터셋 설계

Instruction/Preference 데이터 포맷과 품질 기준을 다룹니다

SFT와 PEFT

LoRA/QLoRA/Unsloth + TRL 워크플로우를 실무 기준으로 설명합니다

정렬(Alignment)

DPO/ORPO/RLHF의 차이와 적용 시점을 비교합니다

평가와 배포

벤치마크, 사람 평가, 체크포인트 머지와 서빙 기준을 정리합니다

선수 지식

항목권장 수준참고
Python / PyTorch텐서, DataLoader, 학습 루프 작성 가능/dl/index
Transformer 기초Attention, decoder-only 구조 이해/nlp/transformer/index
RAG 운영 경험검색 품질/프롬프트 한계 인지/rag/index
처음이라면 개요 -> 언제 파인튜닝할까 -> 데이터셋 설계 순서로 읽고, 이후 SFT/Alignment로 넘어가는 것이 가장 안정적입니다.

학습 완료 기준

  • 이 섹션의 핵심 개념을 팀 문서로 설명할 수 있습니다.
  • 최소 1개 운영 시나리오를 직접 실행하고 결과를 기록할 수 있습니다.
  • 실패 기준과 롤백 기준을 문서로 정의할 수 있습니다.
  • 다음 섹션으로 넘어가기 전 필수 체크리스트를 완료할 수 있습니다.

실무 적용 체크리스트

  • 현재 운영 중인 모델/프롬프트 버전을 식별할 수 있습니다.
  • 품질·비용·지연 중 우선 KPI를 1순위로 정했습니다.
  • 실험과 운영 환경(dev/stage/prod) 경계를 분리했습니다.
  • 주간 리뷰 주기와 담당자를 지정했습니다.

다음 문서

다음: 파인튜닝 개요

학습 흐름을 이어서 진행합니다.