메모리 프로파일링
dtype 다운캐스팅
category 활용
category로 바꾸면 메모리 절감 효과가 큽니다.
chunk 기반 로딩
적용 순서
- 컬럼별 메모리 상위 10개를 먼저 확인합니다.
- 정수/실수 다운캐스팅을 우선 적용합니다.
- 저카디널리티 문자열을
category로 전환합니다. - 그래도 부족하면 chunk 처리로 전환합니다.
이어서 볼 문서
성능 최적화
eval/query, 벡터화, apply 회피 전략을 다룹니다.
데이터 입출력
Parquet/CSV 로딩 전략을 비교합니다.

