Skip to main content
탐색적 데이터 분석(Exploratory Data Analysis, EDA)은 데이터의 구조, 패턴, 이상치를 체계적으로 파악하는 과정입니다. 모델링 전에 데이터를 깊이 이해하면, 더 나은 피처 선택과 전처리 전략을 수립할 수 있습니다.
주제핵심 내용유형
EDA 프로세스체계적 분석 절차, 질문 설계, 보고절차 가이드
단변량 분석수치형 분포, 범주형 빈도, 이상치분석 기법
이변량/다변량 분석상관관계, 그룹 비교, 차원 축소분석 기법
자동 EDAydata-profiling, sweetviz, dtale도구 활용
EDA는 정해진 답이 없는 탐색 과정입니다. EDA 프로세스에서 전체 절차를 익힌 뒤, 단변량과 다변량 분석 기법을 적용해 보세요. 반복 작업은 자동 EDA 도구로 효율화할 수 있습니다.

EDA 프로세스

체계적 EDA 절차와 질문 설계법

단변량 분석

수치형 분포, 범주형 빈도, 이상치 탐지

이변량/다변량 분석

상관관계, 그룹 비교, 차원 축소 시각화

자동 EDA

ydata-profiling, sweetviz로 빠른 탐색

학습 목표

  • 이 문서의 핵심 개념을 실제 프로젝트 시나리오로 연결할 수 있습니다.
  • 최소 1개 실습 과제를 수행하고 결과를 비교할 수 있습니다.
  • 다음 단계에서 필요한 입력 데이터/도구를 준비할 수 있습니다.

실무 적용 체크리스트

  • 실험/운영에서 사용할 평가 지표를 먼저 정했습니다.
  • 베이스라인과 비교할 기준 조건을 고정했습니다.
  • 실패 시 복구 또는 롤백 기준을 문서화했습니다.
  • 팀 공유 문서에 적용 결과를 기록했습니다.

다음 문서

다음: EDA 프로세스

학습 흐름을 이어서 진행합니다.