[2603.23488] One View Is Enough! Monocular Training for In-the-Wild Novel View Generation

논문 정보

날짜: 2026-03-25
카테고리: -
우선순위 점수: 0.1

핵심 요약

OVIE는 다중 뷰 이미지 쌍 없이 단일 이미지 데이터만으로 학습 가능한 새로운 시점 합성 모델입니다. 단안 깊이 추정기를 기하학적 가이드로 활용하여 가상의 타겟 뷰를 생성하고, 가려진 영역을 제외한 마스크 기반 손실 함수를 통해 3,000만 개의 야생 이미지를 학습에 활용했습니다. 추론 시에는 깊이 추정기 없이도 기존 모델 대비 제로샷 성능이 우수하며 속도는 약 600배 빠릅니다.

학습자 관점 포인트

우리 팀 영향: 데이터 수집 비용이 큰 다중 뷰 데이터셋 없이도 대규모 일반 이미지를 활용해 고성능 시점 합성 모델을 구축할 수 있는 가능성을 제시합니다.
권장 액션: 실험
액션 근거: 추론 속도가 매우 빠르고 대규모 비정형 데이터로 학습 가능하다는 점에서 서비스 적용 가능성을 확인하기 위한 벤치마크 테스트가 필요합니다.

원문 링크

arXiv: https://arxiv.org/abs/2603.23488
Hugging Face Papers: https://huggingface.co/papers/2603.23488

학습자는 이 문서를 읽고 실험 여부를 바로 결정하세요.

[2603.22606] TrajLoom: Dense Future Trajectory Generation from Video [2603.22042] Uncertainty-guided Compositional Alignment with Part-to-Whole Semantic Representativeness in Hyperbolic Vision-Language Models

​논문 정보

​핵심 요약

​학습자 관점 포인트

​원문 링크

논문 정보

핵심 요약

학습자 관점 포인트

원문 링크