set_index, reset_index, reindex를 중심으로 실무 인덱스 운영 기준을 정리합니다.
인덱스 전략
| 상황 | 권장 인덱스 |
|---|---|
| 일반 전처리/모델 입력 | RangeIndex 유지 |
| 시계열 집계/리샘플링 | DatetimeIndex |
| 계층형 리포트 | MultiIndex |
RangeIndex, 시계열 단계에서만 DatetimeIndex를 올리는 방식이 운영 난이도를 낮춥니다.
핵심 연산
중복 인덱스 점검
loc 선택 결과가 단일 행이 아닌 다중 행으로 바뀌어 이후 연산을 흔들 수 있습니다.
실무 팁
- 결합 키를 인덱스로 올렸다면
drop=False로 원본 컬럼을 유지합니다. - 저장(Parquet) 직전에는
reset_index()로 평탄화하면 타 시스템 연동이 쉬워집니다. - 시계열 인덱스는 timezone 정책(UTC 저장, 지역시간 분석)을 문서로 고정합니다.

