학습 유형
머신러닝 알고리즘은 데이터에 라벨(정답)이 있는지 여부와 학습 방식에 따라 크게 세 가지 유형으로 분류됩니다.학습 목표
- 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)의 차이를 설명할 수 있습니다.
- 각 학습 유형에 적합한 문제 유형과 데이터 요구사항을 파악할 수 있습니다.
- 반지도학습(Semi-supervised Learning)과 자기지도학습(Self-supervised Learning)의 개념을 이해합니다.
- 주어진 문제에 적절한 학습 유형을 선택할 수 있습니다.
왜 중요한가
학습 유형을 올바르게 선택하는 것은 ML 프로젝트의 첫 번째 의사결정입니다. 라벨이 있는 데이터에 비지도학습을 적용하거나, 라벨이 없는 데이터에 지도학습을 시도하면 시간과 자원을 낭비하게 됩니다.핵심 개념
학습 유형 비교 요약
| 구분 | 지도학습 | 비지도학습 | 강화학습 |
|---|---|---|---|
| 라벨 필요 여부 | 필요 (입력-출력 쌍) | 불필요 | 불필요 (보상 신호 사용) |
| 목표 | 입력 → 출력 매핑 학습 | 데이터 구조/패턴 발견 | 보상 최대화 전략 학습 |
| 대표 문제 | 분류, 회귀 | 군집화, 차원 축소 | 게임, 로봇 제어 |
| 평가 방법 | 정답과 비교 | 내부 지표 (실루엣 등) | 누적 보상 |
| 데이터 비용 | 높음 (라벨링 비용) | 낮음 | 중간 (환경 설계 비용) |
지도학습 (Supervised Learning)
정의: 입력 데이터와 해당하는 정답(라벨)의 쌍으로 학습하여, 새로운 입력에 대한 출력을 예측하는 방법입니다. 지도학습은 다시 두 가지 하위 유형으로 나뉩니다. 분류(Classification): 이산적인 클래스 라벨을 예측합니다.비지도학습 (Unsupervised Learning)
정의: 라벨 없이 입력 데이터만으로 데이터의 구조, 패턴, 분포를 발견하는 방법입니다.강화학습 (Reinforcement Learning)
정의: 에이전트(Agent)가 환경(Environment)과 상호작용하면서 보상(Reward)을 최대화하는 행동 전략(정책, Policy)을 학습하는 방법입니다.| 요소 | 설명 | 예시 (체스) |
|---|---|---|
| 에이전트(Agent) | 의사결정 주체 | 체스 플레이어 |
| 환경(Environment) | 에이전트가 상호작용하는 세계 | 체스판 |
| 상태(State) | 현재 환경의 상황 | 말들의 배치 |
| 행동(Action) | 에이전트가 취할 수 있는 선택 | 말 이동 |
| 보상(Reward) | 행동의 결과에 대한 피드백 | 승리(+1), 패배(-1) |
이 사이트의 ML 탭은 지도학습과 비지도학습에 집중합니다. 강화학습은 별도의 학습 영역으로 다루어지며, 여기서는 개념 비교를 위해 소개합니다.
기타 학습 유형
| 학습 유형 | 설명 | 활용 예시 |
|---|---|---|
| 반지도학습(Semi-supervised) | 소량의 라벨 + 다량의 비라벨 데이터를 결합 | 의료 이미지 분류 (라벨링 비용이 높은 경우) |
| 자기지도학습(Self-supervised) | 데이터 자체에서 학습 신호를 생성 | BERT, GPT 등 언어 모델의 사전학습 |
| 전이학습(Transfer Learning) | 한 도메인에서 학습한 지식을 다른 도메인에 적용 | ImageNet 사전학습 모델 활용 |
AI/ML에서의 활용
실무에서는 하나의 프로젝트에서 여러 학습 유형을 결합하는 경우가 많습니다.- 비지도 → 지도: 군집화로 라벨을 생성한 후 분류 모델 학습
- 차원 축소 → 분류: PCA로 차원을 줄인 후 분류 모델 적용
- 이상 탐지 → 분류: 이상 탐지로 1차 필터링 후 정밀 분류
Q: 라벨이 일부만 있을 때는 어떤 학습 유형을 써야 하나요?
Q: 라벨이 일부만 있을 때는 어떤 학습 유형을 써야 하나요?
라벨이 있는 데이터가 전체의 10% 미만이라면 반지도학습을 고려하세요. Label Propagation이나 Self-Training 알고리즘이 이런 상황에 적합합니다.
Q: 비지도학습의 성능은 어떻게 평가하나요?
Q: 비지도학습의 성능은 어떻게 평가하나요?
외부 라벨이 없으므로 내부 지표를 사용합니다. 군집화의 경우 실루엣 점수(Silhouette Score), 칼린스키-하라바스 인덱스(Calinski-Harabasz Index) 등이 대표적입니다. 자세한 내용은 모델 평가 섹션을 참고하세요.
Q: 지도학습과 비지도학습 중 어떤 것을 먼저 배워야 하나요?
Q: 지도학습과 비지도학습 중 어떤 것을 먼저 배워야 하나요?
지도학습부터 시작하는 것을 권장합니다. 결과를 정답과 비교할 수 있어서 모델의 성능을 직관적으로 이해할 수 있기 때문입니다. 이후 비지도학습으로 확장하면 자연스럽습니다.
체크리스트
- 지도학습, 비지도학습, 강화학습의 차이를 설명할 수 있다
- 분류와 회귀의 차이를 구분할 수 있다
- 주어진 데이터셋에 적합한 학습 유형을 선택할 수 있다
- 반지도학습의 활용 시나리오를 설명할 수 있다

