논문 정보
- 날짜:
2026-03-02 - 카테고리: -
- 우선순위 점수: 1.233
핵심 요약
DLEBench는 이미지 내 1%~10% 크기의 소형 객체 편집 능력을 평가하기 위해 설계된 최초의 벤치마크입니다. 7가지 명령 유형과 1,889개의 샘플을 통해 부분 가려짐 및 다중 객체 편집 등 복잡한 시나리오를 다룹니다. LMM 평가 모델과 인간 판단 사이의 불일치를 해결하기 위해 도구 기반 및 오라클 가이드 모드를 포함한 이중 모드 평가 프레임워크를 제안합니다.학습자 관점 포인트
- 우리 팀 영향: 소형 객체에 대한 정밀한 로컬 편집 성능을 정량적으로 측정함으로써 이미지 편집 모델의 세부 제어 능력을 고도화하는 데 기여할 수 있습니다.
- 권장 액션: 실험
- 액션 근거: 기존 모델들이 소형 객체 편집에서 큰 성능 격차를 보이고 있어, 제안된 벤치마크를 활용한 현재 모델의 정밀도 검증이 필요합니다.
원문 링크
- arXiv: https://arxiv.org/abs/2602.23622
- Hugging Face Papers: https://huggingface.co/papers/2602.23622

