| 순서 | 주제 | 핵심 효과 |
|---|---|---|
| 1 | 학습률 스케줄러 | 학습 안정성 + 최종 성능 향상 |
| 2 | Mixed Precision | 학습 속도 2배 + 메모리 절약 |
| 3 | 기울기 누적 | 작은 GPU로 큰 배치 효과 |
| 4 | 분산 학습 | 여러 GPU로 학습 가속 |
| 5 | 실험 추적 | 재현 가능한 실험 관리 |
학습률 스케줄러
CosineAnnealing, OneCycleLR, Warmup 전략
Mixed Precision
FP16/BF16으로 학습 가속
기울기 누적
작은 GPU 메모리로 큰 배치 효과
분산 학습
DDP, FSDP로 다중 GPU 학습
실험 추적
MLflow로 체계적 실험 관리

