스케줄러 비교
| 스케줄러 | 형태 | 주 사용처 | 호출 시점 |
|---|---|---|---|
| StepLR | 계단식 감쇠 | 간단한 실험 | 에포크 |
| CosineAnnealingLR | 코사인 감쇠 | CNN 학습 | 에포크 |
| OneCycleLR | 증가 → 감소 | 빠른 수렴 | 배치 |
| Warmup + Cosine | 선형 증가 → 코사인 감소 | Transformer | 배치 |
체크리스트
- CosineAnnealing과 OneCycleLR의 차이를 이해한다
- Warmup의 목적과 적용 방법을 안다
-
scheduler.step()의 호출 시점(에포크 vs 배치)을 구분할 수 있다
다음 문서
Mixed Precision
FP16/BF16으로 학습 속도를 2배 가속
옵티마이저
스케줄러와 함께 사용하는 옵티마이저 복습

