Skip to main content
전처리 로직은 작은 코드 변경으로도 결과가 달라질 수 있습니다. pandas.testing 유틸을 사용하면 스키마/값 변화를 자동으로 검증할 수 있습니다.

핵심 도구

  • assert_frame_equal
  • assert_series_equal
  • assert_index_equal

예시

from pandas.testing import assert_frame_equal

actual = transform_orders(raw_df)
expected = pd.read_parquet("tests/golden/orders_expected.parquet")

assert_frame_equal(
    actual.sort_index(axis=1),
    expected.sort_index(axis=1),
    check_dtype=True,
    check_like=True,
)

수치 허용오차

assert_frame_equal(
    actual,
    expected,
    rtol=1e-6,
    atol=1e-8,
)
부동소수 연산이 포함된 파이프라인은 허용오차를 명시해 flaky 테스트를 줄입니다.

운영 기준

  1. 핵심 파이프라인은 golden dataset 기반 회귀 테스트를 둡니다.
  2. 컬럼 순서보다 스키마/값 일치 여부를 우선 검증합니다.
  3. 품질 지표(결측률, 중복률)도 테스트 어설션에 포함합니다.

이어서 볼 문서