Concat과 Append
pd.concat()은 여러 DataFrame을 행(위아래) 또는 열(좌우) 방향으로 연결합니다. 월별 데이터를 하나로 합치거나, 여러 소스의 피처를 옆으로 붙일 때 사용합니다.
학습 목표
- pd.concat으로 행/열 방향 연결을 수행할 수 있다
- 인덱스 정렬과 충돌 해결 방법을 이해한다
- concat과 merge의 차이를 설명할 수 있다
왜 중요한가
대규모 데이터 분석에서는 월별, 지역별로 분할된 파일을 하나로 통합하는 작업이 빈번합니다. chunksize로 분할 처리한 결과를 합치거나, 교차 검증의 각 폴드 결과를 통합할 때도 concat이 필요합니다.행 방향 연결 (axis=0)
열 방향 연결 (axis=1)
인덱스 정렬
DataFrame.append()는 Pandas 2.0에서 제거되었습니다. 항상 pd.concat()을 사용하세요.실무 패턴: 여러 파일 합치기
AI/ML에서의 활용
- 데이터 통합: 여러 소스의 학습 데이터를 하나로 합칩니다
- 교차 검증: 각 폴드의 예측 결과를 concat으로 통합합니다
- 피처 결합: 서로 다른 전처리 결과를 열 방향으로 연결합니다
- 청크 처리: chunksize로 분할 처리한 결과를 최종 합칩니다
concat과 merge의 차이는 무엇인가요?
concat과 merge의 차이는 무엇인가요?
concat()은 단순히 데이터를 이어 붙이는 연산이고, merge()는 키를 기준으로 매칭하여 결합합니다. 같은 구조의 데이터를 쌓을 때는 concat, 키 기반으로 결합할 때는 merge를 사용합니다.concat 시 열 순서가 달라도 되나요?
concat 시 열 순서가 달라도 되나요?
네, Pandas가 자동으로 열 이름을 매칭합니다. 한쪽에만 있는 열은 NaN으로 채워집니다. 열 순서가 다르면 결과의 열 순서가 예측하기 어려울 수 있으므로 필요 시
.reindex(columns=...)로 정렬하세요.체크리스트
- pd.concat으로 행/열 방향 연결을 수행할 수 있다
- ignore_index의 용도를 이해한다
- keys 파라미터로 출처를 표시할 수 있다
- 열이 다른 DataFrame을 concat할 때의 동작을 이해한다
- 여러 파일을 glob + concat으로 합칠 수 있다

