Pandas 심화
Pandas는 표 형태(tabular) 데이터를 다루는 Python의 핵심 라이브러리입니다. ML 프로젝트에서 데이터 로드, 탐색, 정제, 변환, 집계의 90% 이상이 Pandas로 이루어집니다. 이 섹션에서는 데이터 구조 이해부터 성능 최적화까지, 실무에서 바로 활용할 수 있는 Pandas 역량을 쌓습니다.| 하위 그룹 | 주제 | 페이지 수 |
|---|---|---|
| 데이터 구조와 입출력 | Series/DataFrame, CSV/Excel/JSON/Parquet, loc/iloc | 3 |
| 데이터 변환 | dtype, 문자열/날짜, apply/lambda, groupby, 피벗 | 5 |
| 데이터 결합과 정리 | merge/join, concat, 결측치, 중복/이상치 | 4 |
| 시계열과 성능 | DatetimeIndex, 윈도우 함수, eval/query 최적화 | 3 |
Series와 DataFrame
Pandas의 핵심 데이터 구조를 이해합니다
데이터 입출력
CSV, Excel, JSON, Parquet 파일을 읽고 씁니다
인덱싱과 선택
loc/iloc, 조건 필터링, query()를 학습합니다
자료형 변환
astype, to_numeric, 카테고리형 변환을 다룹니다
문자열과 날짜
.str 접근자와 to_datetime을 활용합니다
apply와 Lambda
apply, map과 벡터화 연산을 비교합니다
GroupBy와 집계
groupby, agg, transform으로 그룹별 분석합니다
피벗과 Melt
데이터를 재구조화하는 피벗과 melt를 배웁니다
Merge와 Join
여러 데이터프레임을 키 기반으로 결합합니다
Concat과 Append
행/열 방향으로 데이터프레임을 연결합니다
결측치 처리
결측치 탐지, 삭제, 대체 전략을 학습합니다
중복과 이상치
중복 행 처리와 IQR/Z-score 이상치 탐지를 다룹니다
시계열 데이터
DatetimeIndex, resample, 시간대 처리를 배웁니다
윈도우 함수
rolling, expanding, ewm 윈도우 연산을 학습합니다
성능 최적화
eval/query, 카테고리형, 대용량 처리 전략을 다룹니다

