Faster R-CNN — Two-stage 객체 탐지의 표준
Faster R-CNN은 Region Proposal Network(RPN)를 도입하여 영역 제안과 분류를 단일 네트워크로 통합한 Two-stage 탐지 모델입니다. YOLO보다 느리지만 정밀도가 높아 연구와 정밀 탐지에 활용됩니다.핵심 아이디어
R-CNN 계열은 “어디에 객체가 있을까?”(영역 제안)와 “무슨 객체인가?”(분류)를 2단계로 나누어 수행합니다. Faster R-CNN은 영역 제안을 별도의 알고리즘(Selective Search) 대신 학습 가능한 RPN으로 대체하여 속도와 성능을 모두 개선했습니다.동작 방식
RPN (Region Proposal Network)
RPN은 특징맵 위를 슬라이딩하며 각 위치에서 앵커(Anchor) 박스들이 객체인지 배경인지 판단합니다. 객체일 가능성이 높은 영역을 제안(Proposal)합니다.RoI Pooling
제안된 영역은 크기가 제각각이므로, RoI Pooling으로 고정 크기(예: 7x7)로 변환한 뒤 분류와 박스 회귀를 수행합니다.구현
torchvision Faster R-CNN
커스텀 데이터셋 학습
관련 기술 비교
| 비교 항목 | R-CNN | Fast R-CNN | Faster R-CNN |
|---|---|---|---|
| 영역 제안 | Selective Search | Selective Search | RPN (학습 가능) |
| 특징 추출 | 개별 CNN | 공유 CNN | 공유 CNN |
| 속도 | 매우 느림 | 느림 | 보통 |
| End-to-End | 불가 | 부분 | 완전 |
Faster R-CNN은 언제 YOLO보다 나은가요?
Faster R-CNN은 언제 YOLO보다 나은가요?
소형 객체가 많거나, 밀집된 객체를 정밀하게 탐지해야 할 때 Faster R-CNN이 유리할 수 있습니다. 그러나 최신 YOLO 모델들이 이 격차를 많이 줄였으며, 실무에서는 속도 때문에 YOLO를 더 자주 선택합니다.
FPN은 무엇인가요?
FPN은 무엇인가요?
Feature Pyramid Network(FPN)는 다중 스케일 특징맵을 구성하여 크기가 다른 객체를 효과적으로 탐지합니다. Faster R-CNN + FPN 조합이 표준이며, torchvision의
fasterrcnn_resnet50_fpn이 이 구조입니다.참고 논문
| 논문 | 학회/연도 | 링크 |
|---|---|---|
| Faster R-CNN | NeurIPS 2015 | arXiv:1506.01497 |
| Feature Pyramid Networks (FPN) | CVPR 2017 | arXiv:1612.03144 |

