논문 정보
- 날짜:
2026-04-07 - 카테고리: -
- 우선순위 점수: 0.833
핵심 요약
SpatialEdit-Bench는 이미지 내 객체의 기하학적 변환과 카메라 시점 조정을 정밀하게 평가하기 위한 벤치마크입니다. 이를 위해 Blender를 활용한 50만 개의 합성 데이터셋인 SpatialEdit-500k를 구축하고, 16B 파라미터 규모의 베이스라인 모델을 제안했습니다. 제안된 모델은 일반적인 편집 성능을 유지하면서도 세밀한 공간 조작 작업에서 기존 방식보다 우수한 성능을 보였습니다.학습자 관점 포인트
- 우리 팀 영향: 정밀한 객체 레이아웃 및 카메라 시점 제어가 필요한 이미지 생성 및 편집 서비스의 품질 평가 지표로 활용할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 합성 데이터 생성 파이프라인과 16B 모델의 공간 제어 능력이 실제 서비스의 정밀 편집 요구사항을 충족하는지 검증이 필요합니다.
원문 링크
- arXiv: https://arxiv.org/abs/2604.04911
- Hugging Face Papers: https://huggingface.co/papers/2604.04911

