모델 유형
- 카테고리:
ensemble - 라이브러리:
lightgbm
핵심 학습 포인트
- 데이터 분포와 모델 가정을 함께 확인합니다.
- 하이퍼파라미터 변화가 결정 경계/예측값에 미치는 영향을 확인합니다.
- 검증셋 기준으로 일반화 성능을 확인합니다.
주요 하이퍼파라미터
| 키 | UI 라벨 | 타입 | 기본값 |
|---|---|---|---|
nEstimators | N Estimators | slider | 10 |
learningRate | Learning Rate | slider | 0.1 |
실습 및 공식 문서
- 머신러닝 Visual LAB: /ensemble/lightgbm-regressor
- 공식 문서: 바로가기
- 공식 API 인덱스: 바로가기
언제 쓰나
단일 모델의 분산을 줄이고 성능 안정성을 높여야 할 때 사용합니다. 작은 실험셋으로 빠르게 기준 성능을 확인한 뒤, 필요하면 더 복잡한 모델로 확장합니다.실무 적용 체크리스트
- 데이터 누수 가능성을 먼저 점검했습니다.
- 학습/검증/테스트 분할 기준을 고정했습니다.
- 핵심 지표(예: F1, RMSE, AUC)를 명시했습니다.
- 베이스라인 대비 개선폭과 비용 변화를 함께 기록했습니다.
자주 나는 실수
- 데이터 분할 전에 전처리를 수행해 데이터 누수가 발생합니다.
- 단일 지표만 보고 모델을 선택해 운영 성능이 불안정해집니다.
- 하이퍼파라미터를 과도하게 조정해 검증셋 과적합이 생깁니다.
다음 문서
다음: Random Forest
학습 흐름을 이어서 진행합니다.

