학습 로드맵
선수 지식
도구 개요
| 도구 | 용도 | 이 탭에서 다루는 범위 |
|---|---|---|
| NumPy | 수치 배열 연산 | 배열 생성부터 선형대수, 성능 최적화까지 |
| Pandas | 표 형태 데이터 조작 | Series/DataFrame, 전처리, 시계열, 성능 |
| Matplotlib | 정적 시각화 | Figure/Axes, 분포, 서브플롯 |
| Seaborn | 통계 시각화 | 범주형, 분포, 관계형 차트 |
| Plotly | 인터랙티브 시각화 | Express, 서브플롯, 애니메이션 |
| SciPy | 통계 검정 | t-test, chi-square, ANOVA |
| scikit-learn | 전처리 파이프라인 | Scaler, Encoder, Pipeline |
| SQLAlchemy | DB 연동 | 엔진 생성, 쿼리 실행 |
NumPy 심화
배열 연산, 브로드캐스팅, 선형대수, 성능 최적화
Pandas 심화
DataFrame 조작, 전처리, 시계열, 성능 튜닝
데이터 시각화
Matplotlib, Seaborn, Plotly로 데이터 시각화
통계 기초
기술통계, 확률분포, 가설검정, 상관분석
탐색적 데이터 분석
체계적 EDA 절차와 자동화 도구
데이터 전처리
결측치 대체, 인코딩, 스케일링, Pipeline
SQL과 데이터 분석
Pandas와 SQL 연동, SQLAlchemy
실무 프로젝트
Titanic EDA, 이커머스 분석, 시계열 EDA

