깊이 추정 — 2D에서 3D 거리 이해
깊이 추정(Depth Estimation)은 단일 이미지에서 각 픽셀까지의 거리(깊이)를 예측하는 태스크입니다. 3D 재구성, AR/VR, 로봇 내비게이션, 자율주행에 활용됩니다.핵심 아이디어
인간은 양안 시차(Stereo Vision)로 깊이를 인식하지만, 단안 깊이 추정(Monocular Depth Estimation)은 단일 카메라 이미지만으로 깊이를 추정합니다. 원근법, 텍스처 밀도, 오클루전 등의 시각적 단서를 학습합니다.동작 방식
| 유형 | 출력 | 활용 |
|---|---|---|
| 상대 깊이(Relative) | 순서 관계만 (가까움/멀음) | 시각 효과, 배경 분리 |
| 절대 깊이(Metric) | 실제 거리(미터) | 로봇, 자율주행 |
구현
Depth Anything V2 (Transformers)
MiDaS (PyTorch Hub)
관련 기술 비교
| 모델 | 방식 | 속도 | 정확도 | 특징 |
|---|---|---|---|---|
| MiDaS | DPT (ViT + Dense Prediction) | 보통 | 높음 | 범용 상대 깊이 |
| Depth Anything V2 | DINOv2 기반 | 빠름 | 매우 높음 | 최신, 범용 추천 |
| ZoeDepth | MiDaS + Metric Head | 보통 | 높음 | 절대 깊이 가능 |
| UniDepth | 범용 Metric Depth | 보통 | 높음 | 카메라 내재 파라미터 불필요 |
상대 깊이와 절대 깊이의 차이는?
상대 깊이와 절대 깊이의 차이는?
상대 깊이는 “A가 B보다 가깝다”는 순서만 알려줍니다. 절대 깊이는 “A까지 3.2m, B까지 5.7m”처럼 실제 거리를 제공합니다. 대부분의 범용 모델은 상대 깊이를 출력하며, 절대 깊이가 필요하면 Metric Depth 모델을 사용해야 합니다.
참고 논문
| 논문 | 학회/연도 | 링크 |
|---|---|---|
| MiDaS: Towards Robust Monocular Depth | IEEE T-PAMI 2022 | arXiv:1907.01341 |
| Depth Anything | CVPR 2024 | arXiv:2401.10891 |
| Depth Anything V2 | NeurIPS 2024 | arXiv:2406.09414 |

