학습률 스케줄러
학습률(Learning Rate)을 학습 과정에서 동적으로 조정하는 기법입니다. 초반에는 높은 학습률로 빠르게 탐색하고, 후반에는 낮은 학습률로 정밀하게 수렴합니다.스케줄러 비교
| 스케줄러 | 형태 | 주 사용처 | 호출 시점 |
|---|---|---|---|
| StepLR | 계단식 감쇠 | 간단한 실험 | 에포크 |
| CosineAnnealingLR | 코사인 감쇠 | CNN 학습 | 에포크 |
| OneCycleLR | 증가 → 감소 | 빠른 수렴 | 배치 |
| Warmup + Cosine | 선형 증가 → 코사인 감소 | Transformer | 배치 |
체크리스트
- CosineAnnealing과 OneCycleLR의 차이를 이해한다
- Warmup의 목적과 적용 방법을 안다
-
scheduler.step()의 호출 시점(에포크 vs 배치)을 구분할 수 있다

