YOLO 시리즈 — 실시간 객체 탐지의 진화
YOLO(You Only Look Once)는 이미지를 한 번만 보고(One-stage) 객체의 위치와 클래스를 동시에 예측하는 실시간 탐지 모델입니다. 2015년 첫 등장 이후 지속적으로 발전하며 실무 표준이 되었습니다.핵심 아이디어
전통적인 Two-stage 탐지(R-CNN 계열)는 영역 제안(Region Proposal)과 분류를 별도로 수행합니다. YOLO는 이를 하나의 회귀 문제로 통합하여, 이미지 전체를 그리드(Grid)로 나누고 각 그리드 셀에서 바운딩 박스와 클래스를 동시에 예측합니다.동작 방식
| 구성 요소 | 역할 | 예시 |
|---|---|---|
| 백본(Backbone) | 이미지에서 특징 추출 | CSPDarknet, EfficientNet |
| 넥(Neck) | 다중 스케일 특징 융합 | FPN, PAN, BiFPN |
| 헤드(Head) | 최종 예측 (박스, 클래스, 신뢰도) | Coupled/Decoupled Head |
YOLO 버전 비교
| 버전 | 연도 | 관리 주체 | 핵심 개선 | 특징 |
|---|---|---|---|---|
| YOLOv5 | 2020 | Ultralytics | AutoAnchor, 증강 강화 | PyTorch 기반, 실무 표준 |
| YOLOv6 | 2022 | Meituan | RepVGG 백본, 효율 최적화 | 산업용 최적화 |
| YOLOv7 | 2022 | WongKinYiu | E-ELAN, 계획적 재매개변수화 | 학술 기반 개선 |
| YOLOv8 | 2023 | Ultralytics | Anchor-free, Decoupled Head | 통합 CLI, 멀티태스크 |
| YOLOv9 | 2024 | WongKinYiu | PGI, GELAN | 정보 손실 최소화 |
| YOLOv10 | 2024 | Tsinghua | NMS-free, 일관적 듀얼 할당 | 후처리 제거 |
| YOLO11 | 2024 | Ultralytics | C3k2, SPPF 개선 | 최신, 속도/성능 균형 |
Anchor-based vs Anchor-free
| 방식 | 설명 | 사용 버전 |
|---|---|---|
| Anchor-based | 사전 정의된 앵커 박스 기반 예측 | YOLOv5, v7 |
| Anchor-free | 앵커 없이 중심점 기반 예측 | YOLOv8, v10, YOLO11 |
구현
Ultralytics 설치 및 기본 사용
모델 크기별 비교
| 모델 | 파라미터 | COCO mAP@50:95 | 추론 속도 (T4) | 추천 용도 |
|---|---|---|---|---|
| YOLO11n | 2.6M | 39.5% | 1.5ms | 엣지, 모바일 |
| YOLO11s | 9.4M | 47.0% | 2.5ms | 경량 서버 |
| YOLO11m | 20.1M | 51.5% | 4.7ms | 범용 (추천) |
| YOLO11l | 25.3M | 53.4% | 6.2ms | 고성능 서버 |
| YOLO11x | 56.9M | 54.7% | 11.3ms | 최고 정확도 |
관련 기술 비교
| 비교 항목 | YOLO | Faster R-CNN | DETR |
|---|---|---|---|
| 방식 | One-stage | Two-stage | Transformer |
| 속도 | 매우 빠름 | 느림 | 보통 |
| 정확도 | 높음 | 매우 높음 | 높음 |
| 후처리 | NMS 필요 | NMS 필요 | NMS 불필요 |
| 소형 객체 | 보통 | 좋음 | 보통 |
| 실무 채택 | 매우 높음 | 보통 | 증가 중 |
어떤 YOLO 버전을 선택해야 하나요?
어떤 YOLO 버전을 선택해야 하나요?
Ultralytics에서 관리하는 YOLO11(최신)을 추천합니다. Ultralytics는 통일된 CLI와 Python API를 제공하며, 모델 학습/추론/배포가 가장 간편합니다. 이전 프로젝트와의 호환성이 필요하면 YOLOv8을 사용하세요.
YOLO의 NMS란 무엇인가요?
YOLO의 NMS란 무엇인가요?
비최대 억제(Non-Maximum Suppression)는 하나의 객체에 대해 여러 개 생성된 바운딩 박스 중 가장 신뢰도가 높은 하나만 남기는 후처리 과정입니다. YOLOv10은 NMS 없이 학습하는 방식을 도입했습니다.
참고 논문
| 논문 | 학회/연도 | 링크 |
|---|---|---|
| You Only Look Once (YOLOv1) | CVPR 2016 | arXiv:1506.02640 |
| YOLOv7: Trainable BoF | CVPR 2023 | arXiv:2207.02696 |
| YOLOv9: Programmable Gradient Information | arXiv 2024 | arXiv:2402.13616 |
| YOLOv10: Real-Time E2E Detection | arXiv 2024 | arXiv:2405.14458 |

