Skip to main content
통계는 데이터에서 의미를 추출하는 수학적 도구입니다. 기술통계(Descriptive Statistics)로 데이터의 특성을 요약하고, 추론통계(Inferential Statistics)로 샘플에서 모집단의 특성을 추정합니다. 이 섹션에서는 데이터 분석과 머신러닝에 필수적인 통계 개념을 Python 코드와 함께 학습합니다.
주제핵심 내용난이도
기술통계중심경향, 산포도, 왜도/첨도기본
확률분포정규분포, 이항분포, 중심극한정리중급
가설검정t-test, chi-square, ANOVA, p-value중급
상관과 회귀피어슨/스피어만, 선형회귀, R-squared중급
수학 공식보다 직관적 이해에 집중합니다. 모든 개념을 Python 코드로 직접 확인하며 학습합니다. 기술통계부터 순서대로 진행하는 것을 권장합니다.

기술통계

중심경향, 산포도, 왜도와 첨도

확률분포

정규분포, 이항분포, 중심극한정리

가설검정

t-test, chi-square, ANOVA, p-value 해석

상관과 회귀

피어슨/스피어만 상관계수, 단순 선형회귀

학습 목표

  • 이 문서의 핵심 개념을 실제 프로젝트 시나리오로 연결할 수 있습니다.
  • 최소 1개 실습 과제를 수행하고 결과를 비교할 수 있습니다.
  • 다음 단계에서 필요한 입력 데이터/도구를 준비할 수 있습니다.

실무 적용 체크리스트

  • 실험/운영에서 사용할 평가 지표를 먼저 정했습니다.
  • 베이스라인과 비교할 기준 조건을 고정했습니다.
  • 실패 시 복구 또는 롤백 기준을 문서화했습니다.
  • 팀 공유 문서에 적용 결과를 기록했습니다.

다음 문서

다음: 기술통계

학습 흐름을 이어서 진행합니다.
통계 결과를 해석할 때는 p-value만 보지 말고 효과 크기와 데이터 맥락을 함께 확인합니다.