XGBoost Ranker - 배움 에이아이

00. 시작하기

01. 데이터와 평가

02. 실무 파이프라인

03. 지도학습

04. 비지도학습

05. 특수 학습 기법

06. 통계 모델링

XGBoost 그래디언트 부스팅을 사용한 쌍별/리스트별 순위 모델입니다. Pairwise/listwise ranking model using XGBoost gradient boosting.

모델 유형

카테고리: ranking
라이브러리: xgboost

핵심 학습 포인트

pairwise/listwise 목적 함수가 순위 학습에 어떻게 반영되는지 이해합니다.
N Trees, Max Depth 변화에 따른 순위 품질/복잡도 변화를 비교합니다.
NDCG@K, MRR 등 순위 지표 기반으로 모델을 평가합니다.

주요 하이퍼파라미터

키	UI 라벨	타입	기본값
`nTrees`	N Trees	`slider`	`20`
`maxDepth`	Max Depth	`slider`	`4`

실습 및 공식 문서

머신러닝 Visual LAB: /ranking/xgboost-ranker
공식 문서: XGBRanker
공식 API 인덱스: 바로가기

언제 쓰나

검색/추천처럼 결과 순서 자체가 품질을 좌우하는 문제에 사용합니다. 작은 실험셋으로 빠르게 기준 성능을 확인한 뒤, 필요하면 더 복잡한 모델로 확장합니다.

실무 적용 체크리스트

데이터 누수 가능성을 먼저 점검했습니다.
학습/검증/테스트 분할 기준을 고정했습니다.
핵심 지표(예: F1, RMSE, AUC)를 명시했습니다.
베이스라인 대비 개선폭과 비용 변화를 함께 기록했습니다.

자주 나는 실수

데이터 분할 전에 전처리를 수행해 데이터 누수가 발생합니다.
단일 지표만 보고 모델을 선택해 운영 성능이 불안정해집니다.
하이퍼파라미터를 과도하게 조정해 검증셋 과적합이 생깁니다.

다음 문서

다음: 클러스터링 (Clustering)

학습 흐름을 이어서 진행합니다.

lightgbm-ranker 클러스터링 (Clustering)