Skip to main content
시계열 집계에서 resample만 사용하면 다중 키(예: 지역, 상품군)와 함께 집계할 때 코드가 길어질 수 있습니다. pd.Grouper를 사용하면 그룹 키 + 시간 버킷을 한 번에 선언할 수 있습니다.

기본 패턴

out = (
    df.groupby([
        "region",
        pd.Grouper(key="ts", freq="W-MON"),
    ], as_index=False)
    .agg(
        revenue=("amount", "sum"),
        orders=("order_id", "nunique"),
    )
)

빈도(frequency) 선택

freq의미
D일 단위
W / W-MON주 단위(주 시작 요일 지정 가능)
M월말 기준
MS월초 기준
Q분기
버킷 경계 기준을 명확히 정하지 않으면 월말/월초 집계 수치가 달라질 수 있습니다.

운영 체크

  • 집계 전 ts를 timezone-aware 타입으로 고정
  • 누락 구간은 reindex 또는 asfreq로 명시
  • 버킷 단위 변경 시 대시보드 지표 비교 기준도 함께 갱신

이어서 볼 문서