YOLO 시리즈 - 배움 에이아이

YOLO(You Only Look Once)는 이미지를 한 번만 보고(One-stage) 객체의 위치와 클래스를 동시에 예측하는 실시간 탐지 모델입니다. 2015년 첫 등장 이후 지속적으로 발전하며 실무 표준이 되었습니다.

핵심 아이디어

전통적인 Two-stage 탐지(R-CNN 계열)는 영역 제안(Region Proposal)과 분류를 별도로 수행합니다. YOLO는 이를 하나의 회귀 문제로 통합하여, 이미지 전체를 그리드(Grid)로 나누고 각 그리드 셀에서 바운딩 박스와 클래스를 동시에 예측합니다.

동작 방식

구성 요소	역할	예시
백본(Backbone)	이미지에서 특징 추출	CSPDarknet, EfficientNet
넥(Neck)	다중 스케일 특징 융합	FPN, PAN, BiFPN
헤드(Head)	최종 예측 (박스, 클래스, 신뢰도)	Coupled/Decoupled Head

YOLO 버전 비교

버전	연도	관리 주체	핵심 개선	특징
YOLOv5	2020	Ultralytics	AutoAnchor, 증강 강화	PyTorch 기반, 실무 표준
YOLOv6	2022	Meituan	RepVGG 백본, 효율 최적화	산업용 최적화
YOLOv7	2022	WongKinYiu	E-ELAN, 계획적 재매개변수화	학술 기반 개선
YOLOv8	2023	Ultralytics	Anchor-free, Decoupled Head	통합 CLI, 멀티태스크
YOLOv9	2024	WongKinYiu	PGI, GELAN	정보 손실 최소화
YOLOv10	2024	Tsinghua	NMS-free, 일관적 듀얼 할당	후처리 제거
YOLO11	2024	Ultralytics	C3k2, SPPF 개선	최신, 속도/성능 균형

Anchor-based vs Anchor-free

방식	설명	사용 버전
Anchor-based	사전 정의된 앵커 박스 기반 예측	YOLOv5, v7
Anchor-free	앵커 없이 중심점 기반 예측	YOLOv8, v10, YOLO11

Anchor-free 방식은 앵커 설계의 번거로움을 제거하고, 다양한 크기의 객체에 더 유연하게 대응합니다.

구현

Ultralytics 설치 및 기본 사용

from ultralytics import YOLO

# 사전학습 모델 로드
model = YOLO('yolo11n.pt')  # nano (가장 가벼운 모델)

# 모델 정보 확인
model.info()

# 이미지 추론
results = model('image.jpg')

# 결과 확인
for result in results:
    boxes = result.boxes
    for box in boxes:
        cls = int(box.cls)
        conf = float(box.conf)
        xyxy = box.xyxy[0].tolist()
        print(f"클래스: {cls}, 신뢰도: {conf:.2f}, 좌표: {xyxy}")

모델 크기별 비교

# 모델 크기 옵션 (n < s < m < l < x)
models = ['yolo11n.pt', 'yolo11s.pt', 'yolo11m.pt', 'yolo11l.pt', 'yolo11x.pt']

모델	파라미터	COCO mAP@50:95	추론 속도 (T4)	추천 용도
YOLO11n	2.6M	39.5%	1.5ms	엣지, 모바일
YOLO11s	9.4M	47.0%	2.5ms	경량 서버
YOLO11m	20.1M	51.5%	4.7ms	범용 (추천)
YOLO11l	25.3M	53.4%	6.2ms	고성능 서버
YOLO11x	56.9M	54.7%	11.3ms	최고 정확도

관련 기술 비교

비교 항목	YOLO	Faster R-CNN	DETR
방식	One-stage	Two-stage	Transformer
속도	매우 빠름	느림	보통
정확도	높음	매우 높음	높음
후처리	NMS 필요	NMS 필요	NMS 불필요
소형 객체	보통	좋음	보통
실무 채택	매우 높음	보통	증가 중

어떤 YOLO 버전을 선택해야 하나요?

Ultralytics에서 관리하는 YOLO11(최신)을 추천합니다. Ultralytics는 통일된 CLI와 Python API를 제공하며, 모델 학습/추론/배포가 가장 간편합니다. 이전 프로젝트와의 호환성이 필요하면 YOLOv8을 사용합니다.

YOLO의 NMS란 무엇인가요?

비최대 억제(Non-Maximum Suppression)는 하나의 객체에 대해 여러 개 생성된 바운딩 박스 중 가장 신뢰도가 높은 하나만 남기는 후처리 과정입니다. YOLOv10은 NMS 없이 학습하는 방식을 도입했습니다.

참고 논문

논문	학회/연도	링크
You Only Look Once (YOLOv1)	CVPR 2016	arXiv:1506.02640
YOLOv7: Trainable BoF	CVPR 2023	arXiv:2207.02696
YOLOv9: Programmable Gradient Information	arXiv 2024	arXiv:2402.13616
YOLOv10: Real-Time E2E Detection	arXiv 2024	arXiv:2405.14458

​핵심 아이디어

​동작 방식

​YOLO 버전 비교

​Anchor-based vs Anchor-free

​구현

​Ultralytics 설치 및 기본 사용

​모델 크기별 비교

​관련 기술 비교

​참고 논문